-
题名面向大规模图像检索的哈希学习综述
被引量:1
- 1
-
-
作者
张雪凝
刘兴波
宋井宽
聂秀山
王少华
尹义龙
-
机构
山东大学软件学院
山东建筑大学计算机科学与技术学院
电子科技大学计算机科学与工程学院
-
出处
《软件学报》
北大核心
2025年第1期79-106,共28页
-
基金
国家自然科学基金(62176141,62176139,61876098,62206160)
山东省自然科学基金青年项目(ZR2022QF082)
+3 种基金
山东省自然科学基金重大基础研究项目(ZR2021ZD15)
山东省青年泰山项目(tsqn202103088)
山东省杰出青年基金(ZR2021JQ26)
山东建筑大学特聘教授专项。
-
文摘
随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即多总结5–10年前的研究成果,且较少总结哈希学习算法各组成部分间的关联关系.鉴于此,通过总结近20年公开发表的哈希学习文献,对面向大规模图像检索的哈希学习进行系统的综述性研究.首先,介绍哈希学习的技术路线和哈希学习算法的主要组成部分,包括损失函数、优化策略及样本外扩展映射.其次,将面向图像检索的哈希学习算法分为无监督哈希方法和监督哈希方法两类,并分别梳理每类方法的研究现状和演化过程.然后,介绍哈希学习算法评估通用的图像数据集与评估指标,并通过对比实验分析部分经典算法的性能.最后,结合哈希学习的局限性与新挑战对其发展前景进行阶段性总结与展望.
-
关键词
图像检索
大规模数据
近似最近邻检索
哈希学习
相似性保持
-
Keywords
image retrieval
large-scale data
approximate nearest neighbor search
hash learning
similarity preserving
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名结合对象属性与近似检索的协同过滤算法
被引量:1
- 2
-
-
作者
陈乐
余粟
-
机构
上海工程技术大学电子电气工程学院
上海工程技术大学图文信息中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第5期972-976,共5页
-
基金
上海市科学技术委员会基金项目(17511110204)资助.
-
文摘
为解决传统协同过滤算法中评分数据高维稀疏、用户评分偏好属性和物品类别偏好属性缺失,而导致推荐效率较低和推荐质量较差的问题,本文提出一种结合对象属性和近似检索的协同过滤算法.首先,算法基于物品和用户的自有属性分别建立物品类别偏好模型和用户评分偏好模型,并将两种模型线性融合,用以修正原始评分数据.其次,算法采用基于p稳态分布的局部敏感哈希对修正评分数据进行降维与索引,以快速获取目标用户的近邻用户集合.最后,算法通过用户相似性度量计算最近邻用户集合,并基于最近邻用户集合计算目标用户的预测评分.实验结果表明,在不同近邻用户数下,所提算法的准确率和召回率均优于传统的协同过滤算法,且运行效率更高.因此所提算法具有更好的推荐质量和更高效的运行效率.
-
关键词
推荐系统
协同过滤
类别偏好
评分偏好
局部敏感哈希
近似最近邻检索
-
Keywords
recommendation system
collaborative filtering
category preference
rating preference
local sensitive hash
approximate nearest neighbor search
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名量化编码的分层可通航小世界图算法
被引量:1
- 3
-
-
作者
李秋珍
白兴强
李立夏
王赢
-
机构
武汉数字工程研究所
华中科技大学计算机科学与技术学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第4期618-625,共8页
-
基金
军委装备发展部科研订购局"十三五"装备预研领域基金(61401320501)
-
文摘
随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界图HNSW检索算法在多个公开数据集取得了最佳的性能表现,但该算法存在内存开销大的问题。而基于量化编码的检索算法能够压缩数据集向量,大幅度降低内存占用。将量化编码和分层可通航小世界图算法结合,提出了2种基于量化编码改进的HNSW算法,分别是使用标量量化编码向量的HNSWSQ算法和使用乘积量化编码向量的HNSWPQ算法,2种算法使用不同的量化策略存储原始向量编码,以降低内存开销,再通过HNSW算法建立索引达到缩短检索耗时的目的。其中HNSWSQ算法在多个数据集上获得了与HNSW算法相近的查全率和平均检索耗时,而内存开销大幅降低。实验结果表明,HNSWSQ算法在SIFT-1M和GIST-1M数据集上的内存开销比HNSW算法分别降低了45.1%和70.4%。
-
关键词
近似最近邻检索
分层可通航小世界图算法
乘积量化
标量量化
相似性搜索
高维数据索引
-
Keywords
approximate nearest neighbor search
hierarchical navigable small world graph algorithm
product quantization
scalar quantization
similarity search
indexing of high-dimensional data
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-