期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
近似检索的一些处理方法
被引量:
11
1
作者
杨宪泽
《计算机工程》
EI
CAS
CSCD
北大核心
1998年第1期34-36,共3页
提高MIS检索能力是计算机应用的一个新课题。文章提出了容错近似检索算法和同音近似检索算法,介绍了近似检索的词义辅助分析的原理。
关键词
MIS
近似检索
词义辅助分析
办公自动化
在线阅读
下载PDF
职称材料
结合对象属性与近似检索的协同过滤算法
被引量:
1
2
作者
陈乐
余粟
《小型微型计算机系统》
CSCD
北大核心
2021年第5期972-976,共5页
为解决传统协同过滤算法中评分数据高维稀疏、用户评分偏好属性和物品类别偏好属性缺失,而导致推荐效率较低和推荐质量较差的问题,本文提出一种结合对象属性和近似检索的协同过滤算法.首先,算法基于物品和用户的自有属性分别建立物品类...
为解决传统协同过滤算法中评分数据高维稀疏、用户评分偏好属性和物品类别偏好属性缺失,而导致推荐效率较低和推荐质量较差的问题,本文提出一种结合对象属性和近似检索的协同过滤算法.首先,算法基于物品和用户的自有属性分别建立物品类别偏好模型和用户评分偏好模型,并将两种模型线性融合,用以修正原始评分数据.其次,算法采用基于p稳态分布的局部敏感哈希对修正评分数据进行降维与索引,以快速获取目标用户的近邻用户集合.最后,算法通过用户相似性度量计算最近邻用户集合,并基于最近邻用户集合计算目标用户的预测评分.实验结果表明,在不同近邻用户数下,所提算法的准确率和召回率均优于传统的协同过滤算法,且运行效率更高.因此所提算法具有更好的推荐质量和更高效的运行效率.
展开更多
关键词
推荐系统
协同过滤
类别偏好
评分偏好
局部敏感哈希
近似
最近邻
检索
在线阅读
下载PDF
职称材料
面向大规模图像检索的哈希学习综述
被引量:
1
3
作者
张雪凝
刘兴波
+3 位作者
宋井宽
聂秀山
王少华
尹义龙
《软件学报》
北大核心
2025年第1期79-106,共28页
随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即...
随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即多总结5–10年前的研究成果,且较少总结哈希学习算法各组成部分间的关联关系.鉴于此,通过总结近20年公开发表的哈希学习文献,对面向大规模图像检索的哈希学习进行系统的综述性研究.首先,介绍哈希学习的技术路线和哈希学习算法的主要组成部分,包括损失函数、优化策略及样本外扩展映射.其次,将面向图像检索的哈希学习算法分为无监督哈希方法和监督哈希方法两类,并分别梳理每类方法的研究现状和演化过程.然后,介绍哈希学习算法评估通用的图像数据集与评估指标,并通过对比实验分析部分经典算法的性能.最后,结合哈希学习的局限性与新挑战对其发展前景进行阶段性总结与展望.
展开更多
关键词
图像
检索
大规模数据
近似
最近邻
检索
哈希学习
相似性保持
在线阅读
下载PDF
职称材料
基于相对编辑相似度的近似重复视频检索和定位
被引量:
6
4
作者
赵清杰
王浩
+1 位作者
刘浩
张聪
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2018年第1期85-90,共6页
为有效对近似重复视频进行检索和定位,提出了一种基于相对编辑相似度的检索和定位算法.算法包括基于局部特征的视频编码和基于相对编辑相似度的在线检索和定位两部分.基于局部特征的视频编码首先提取数据库视频的关键帧,然后在关键帧中...
为有效对近似重复视频进行检索和定位,提出了一种基于相对编辑相似度的检索和定位算法.算法包括基于局部特征的视频编码和基于相对编辑相似度的在线检索和定位两部分.基于局部特征的视频编码首先提取数据库视频的关键帧,然后在关键帧中提取Root-SIFT特征描述符并应用层次K-Means聚类算法构建词典,之后将关键帧量化至词袋模型的单词并编码.基于相对编辑相似度的在线检索和定位首先对查询视频进行编码,然后应用相对编辑相似度算法,筛选近似重复视频并对近似重复片段进行定位.实验结果表明,LD算法比Yeh等提出的算法在平均F1评价准则上效果要高8.55%,并且NDCR降低为原来的29%,效果提升明显.
展开更多
关键词
近似
重复视频
检索
近似
重复视频定位
相对编辑相似度
在线阅读
下载PDF
职称材料
基于深度学习的视频近似拷贝检索
被引量:
2
5
作者
冯兆华
朱允斌
李卫强
《计算机应用与软件》
北大核心
2018年第1期160-163,182,共5页
随着网络和多媒体技术的发展,越来越多的视频数据充斥着互联网,对视频进行有效的管理,尽可能排除其中的重复内容已经成为一项很重要的工作。基于这种现状,设计了一套快速而有效的视频近似拷贝检索系统。不同于传统的视频近似检测方法,...
随着网络和多媒体技术的发展,越来越多的视频数据充斥着互联网,对视频进行有效的管理,尽可能排除其中的重复内容已经成为一项很重要的工作。基于这种现状,设计了一套快速而有效的视频近似拷贝检索系统。不同于传统的视频近似检测方法,该系统采用深度学习的方法,使用深度卷积神经网络快速地为采样帧提取特征,使用k-d树为视频库中的特征值建立索引,从而提高相似查找的速度,最后计算输入视频与所有候选视频的相似度,并按相似度对候选视频排序输出。
展开更多
关键词
近似
拷贝
检索
特征值提取
深度学习
K-D树
相似度度量
在线阅读
下载PDF
职称材料
一种支持非度量空间中近似查询的索引技术
6
作者
彭敦陆
徐文杰
+1 位作者
霍欢
江平
《计算机应用研究》
CSCD
北大核心
2014年第7期1965-1971,共7页
多媒体信息系统通常使用索引技术加快检索,现有索引技术绝大多数都是基于度量空间建立的,其中广泛应用度量空间的三角不等性。在非度量空间中,面向度量空间的索引技术难以快速而准确地完成检索任务。针对多媒体数据对象进行研究,发现其...
多媒体信息系统通常使用索引技术加快检索,现有索引技术绝大多数都是基于度量空间建立的,其中广泛应用度量空间的三角不等性。在非度量空间中,面向度量空间的索引技术难以快速而准确地完成检索任务。针对多媒体数据对象进行研究,发现其具有非度量空间的属性,在建立多媒体数据索引时,采用非度量空间中的计算方法使得所建索引更加有效。结合聚类和pivots技术,提出一种支持非度量空间中的对象索引结构——M+-tree。给出了M+-tree的建立、维护及采用M+-tree进行快速KNN检索的相关算法。实验表明,M+-tree在检索性能和检索效果上比现有的非度量空间的索引结构具有明显优势。
展开更多
关键词
索引结构
非度量空间
近似检索
树结构
聚类
在线阅读
下载PDF
职称材料
开放环境多分布特性的局部敏感哈希检索方法
被引量:
13
7
作者
张仕
赖会霞
+3 位作者
肖如良
潘淼鑫
张路路
陈伟林
《软件学报》
EI
CSCD
北大核心
2022年第4期1200-1217,共18页
基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境...
基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境下多种分布特性的基于Laplacian算子的局部敏感哈希搜索方法(LPLSH).该方法把Laplacian算子应用于数据投影的概率密度分布,找到数据投影分布的剧烈变化位置作为超平面的偏移量.从理论上证明了精简维度的哈希函数能够保持局部敏感性及低投影密度区间分割的有效性,分析了利用Laplacian算子计算的二阶导数对超平面偏移量设置的指导意义.与其他8种方法对比,LPLSH算法的F1值是其他方法最优值的0.8倍-5倍,耗费时间也大幅减少.通过对具有多种分布特性数据集上的实验验证,结果表明:LPLSH方法能够同时兼顾效率、精度和召回率,可满足开放环境下多分布特性的大规模高维检索的鲁棒性需求.
展开更多
关键词
开放环境
近似
近邻
检索
数据多分布特性
局部敏感哈希
数据
检索
在线阅读
下载PDF
职称材料
基于随机森林的哈希检索算法
被引量:
6
8
作者
花强
郭欣欣
+1 位作者
张峰
董春茹
《计算机科学与探索》
CSCD
北大核心
2019年第7期1174-1183,共10页
从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻算法效率降低,而近似最近邻算法发挥了越来越重要的作用。其中...
从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻算法效率降低,而近似最近邻算法发挥了越来越重要的作用。其中哈希算法以其在存储空间和计算时间上的优势受到了广泛关注。提出了一种基于随机森林的哈希算法。该算法通过构建随机森林,将原始空间的样本映射为海明空间的二进制哈希码,并在哈希空间上定义了顺序敏感的海明距离,以最大程度保持数据在原空间的近邻关系不变。由于随机森林中不同决策树所使用的特征空间和学习过程是独立的,可以以增量的方式灵活地确定哈希码的长度。此外基于随机森林的哈希编码算法天然适合并行部署,从而可以大大提高算法速度。最后,在MNIST和CIFAR-10数据集对所提算法进行了实验验证,结果表明了算法的有效性和出色性能。
展开更多
关键词
近似
近邻
检索
(ANNS)
哈希编码
随机森林
顺序敏感的海明距离
在线阅读
下载PDF
职称材料
基于卷积神经网络和监督核哈希的图像检索方法
被引量:
37
9
作者
柯圣财
赵永威
+1 位作者
李弼程
彭天强
《电子学报》
EI
CAS
CSCD
北大核心
2017年第1期157-163,共7页
当前主流的图像检索方法采用的视觉特征,缺乏自主学习能力,导致其图像表达能力不强,此外,传统的特征索引方法检索效率较低,难以适用于大规模图像数据.针对这些问题,本文提出了一种基于卷积神经网络和监督核哈希的图像检索方法.首先,利...
当前主流的图像检索方法采用的视觉特征,缺乏自主学习能力,导致其图像表达能力不强,此外,传统的特征索引方法检索效率较低,难以适用于大规模图像数据.针对这些问题,本文提出了一种基于卷积神经网络和监督核哈希的图像检索方法.首先,利用卷积神经网络的学习能力挖掘训练图像内容的内在隐含关系,提取图像深层特征,增强特征的视觉表达能力和区分性;然后,利用监督核哈希方法对高维图像深层特征进行监督学习,并将高维特征映射到低维汉明空间中,生成紧致的哈希码;最后,在低维汉明空间中完成对大规模图像数据的有效检索.在Image Net-1000和Caltech-256数据集上的实验结果表明,本文方法能够有效地增强图像特征的表达能力,提高图像检索效率,优于当前主流方法.
展开更多
关键词
深度学习
图像
检索
卷积神经网络
近似
近邻
检索
监督核哈希
在线阅读
下载PDF
职称材料
高维空间近邻检索的双层组合量化GPU加速算法
被引量:
5
10
作者
邓理睿
包涵
+2 位作者
陈靓
全成斌
赵有健
《小型微型计算机系统》
CSCD
北大核心
2019年第2期390-394,共5页
在大规模视频、图像、文本检索等许多实际应用中,高维空间内海量数据的索引及近邻检索一直是难点和关键问题之一.传统的K-D树等树形索引方法在高维空间中容易陷入"维度灾难",而主流的哈希散列方法(如局部敏感哈希)空间复杂度...
在大规模视频、图像、文本检索等许多实际应用中,高维空间内海量数据的索引及近邻检索一直是难点和关键问题之一.传统的K-D树等树形索引方法在高维空间中容易陷入"维度灾难",而主流的哈希散列方法(如局部敏感哈希)空间复杂度较高,在大规模数据下难以应用.本文总结了近年来基于向量量化的检索算法的相关研究,提出了一种基于GPU优化的高维数据近似近邻检索算法,在组合量化算法的基础上融合双层索引树结构与局部子空间最优化思想,在提高算法准确率的同时针对GPU模型优化算法,极大改善了检索性能,在单张GPU上实现了十亿量级高维数据的高效近似近邻检索.
展开更多
关键词
近似
近邻
检索
组合量化
GPU
高维索引
在线阅读
下载PDF
职称材料
量化编码的分层可通航小世界图算法
被引量:
1
11
作者
李秋珍
白兴强
+1 位作者
李立夏
王赢
《计算机工程与科学》
CSCD
北大核心
2019年第4期618-625,共8页
随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界...
随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界图HNSW检索算法在多个公开数据集取得了最佳的性能表现,但该算法存在内存开销大的问题。而基于量化编码的检索算法能够压缩数据集向量,大幅度降低内存占用。将量化编码和分层可通航小世界图算法结合,提出了2种基于量化编码改进的HNSW算法,分别是使用标量量化编码向量的HNSWSQ算法和使用乘积量化编码向量的HNSWPQ算法,2种算法使用不同的量化策略存储原始向量编码,以降低内存开销,再通过HNSW算法建立索引达到缩短检索耗时的目的。其中HNSWSQ算法在多个数据集上获得了与HNSW算法相近的查全率和平均检索耗时,而内存开销大幅降低。实验结果表明,HNSWSQ算法在SIFT-1M和GIST-1M数据集上的内存开销比HNSW算法分别降低了45.1%和70.4%。
展开更多
关键词
近似
最近邻
检索
分层可通航小世界图算法
乘积量化
标量量化
相似性搜索
高维数据索引
在线阅读
下载PDF
职称材料
题名
近似检索的一些处理方法
被引量:
11
1
作者
杨宪泽
机构
西南民族学院计算机科学与工程系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
1998年第1期34-36,共3页
文摘
提高MIS检索能力是计算机应用的一个新课题。文章提出了容错近似检索算法和同音近似检索算法,介绍了近似检索的词义辅助分析的原理。
关键词
MIS
近似检索
词义辅助分析
办公自动化
Keywords
MIS
Fault-tolerance
Approximate retrieval, Homonym retrieval, Keyword meaning auxiliary analysis
分类号
TP29 [自动化与计算机技术—检测技术与自动化装置]
C931.4 [经济管理—管理学]
在线阅读
下载PDF
职称材料
题名
结合对象属性与近似检索的协同过滤算法
被引量:
1
2
作者
陈乐
余粟
机构
上海工程技术大学电子电气工程学院
上海工程技术大学图文信息中心
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第5期972-976,共5页
基金
上海市科学技术委员会基金项目(17511110204)资助.
文摘
为解决传统协同过滤算法中评分数据高维稀疏、用户评分偏好属性和物品类别偏好属性缺失,而导致推荐效率较低和推荐质量较差的问题,本文提出一种结合对象属性和近似检索的协同过滤算法.首先,算法基于物品和用户的自有属性分别建立物品类别偏好模型和用户评分偏好模型,并将两种模型线性融合,用以修正原始评分数据.其次,算法采用基于p稳态分布的局部敏感哈希对修正评分数据进行降维与索引,以快速获取目标用户的近邻用户集合.最后,算法通过用户相似性度量计算最近邻用户集合,并基于最近邻用户集合计算目标用户的预测评分.实验结果表明,在不同近邻用户数下,所提算法的准确率和召回率均优于传统的协同过滤算法,且运行效率更高.因此所提算法具有更好的推荐质量和更高效的运行效率.
关键词
推荐系统
协同过滤
类别偏好
评分偏好
局部敏感哈希
近似
最近邻
检索
Keywords
recommendation system
collaborative filtering
category preference
rating preference
local sensitive hash
approximate nearest neighbor search
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向大规模图像检索的哈希学习综述
被引量:
1
3
作者
张雪凝
刘兴波
宋井宽
聂秀山
王少华
尹义龙
机构
山东大学软件学院
山东建筑大学计算机科学与技术学院
电子科技大学计算机科学与工程学院
出处
《软件学报》
北大核心
2025年第1期79-106,共28页
基金
国家自然科学基金(62176141,62176139,61876098,62206160)
山东省自然科学基金青年项目(ZR2022QF082)
+3 种基金
山东省自然科学基金重大基础研究项目(ZR2021ZD15)
山东省青年泰山项目(tsqn202103088)
山东省杰出青年基金(ZR2021JQ26)
山东建筑大学特聘教授专项。
文摘
随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即多总结5–10年前的研究成果,且较少总结哈希学习算法各组成部分间的关联关系.鉴于此,通过总结近20年公开发表的哈希学习文献,对面向大规模图像检索的哈希学习进行系统的综述性研究.首先,介绍哈希学习的技术路线和哈希学习算法的主要组成部分,包括损失函数、优化策略及样本外扩展映射.其次,将面向图像检索的哈希学习算法分为无监督哈希方法和监督哈希方法两类,并分别梳理每类方法的研究现状和演化过程.然后,介绍哈希学习算法评估通用的图像数据集与评估指标,并通过对比实验分析部分经典算法的性能.最后,结合哈希学习的局限性与新挑战对其发展前景进行阶段性总结与展望.
关键词
图像
检索
大规模数据
近似
最近邻
检索
哈希学习
相似性保持
Keywords
image retrieval
large-scale data
approximate nearest neighbor search
hash learning
similarity preserving
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于相对编辑相似度的近似重复视频检索和定位
被引量:
6
4
作者
赵清杰
王浩
刘浩
张聪
机构
北京理工大学计算机学院
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2018年第1期85-90,共6页
基金
国家自然科学基金资助项目(61175096)
文摘
为有效对近似重复视频进行检索和定位,提出了一种基于相对编辑相似度的检索和定位算法.算法包括基于局部特征的视频编码和基于相对编辑相似度的在线检索和定位两部分.基于局部特征的视频编码首先提取数据库视频的关键帧,然后在关键帧中提取Root-SIFT特征描述符并应用层次K-Means聚类算法构建词典,之后将关键帧量化至词袋模型的单词并编码.基于相对编辑相似度的在线检索和定位首先对查询视频进行编码,然后应用相对编辑相似度算法,筛选近似重复视频并对近似重复片段进行定位.实验结果表明,LD算法比Yeh等提出的算法在平均F1评价准则上效果要高8.55%,并且NDCR降低为原来的29%,效果提升明显.
关键词
近似
重复视频
检索
近似
重复视频定位
相对编辑相似度
Keywords
near-duplicate video retrieval
near-duplicate video location
relative LevenshteinDistance similarity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于深度学习的视频近似拷贝检索
被引量:
2
5
作者
冯兆华
朱允斌
李卫强
机构
复旦大学计算机科学技术学院
上海视频技术与系统工程研究中心
上海下一代广播电视网应用实验室有限公司
出处
《计算机应用与软件》
北大核心
2018年第1期160-163,182,共5页
基金
国家重点研发计划项目(2016YFC0801003)
上海市科委科研计划项目(16511105402)
上海市人才计划项目(17XD1425000)
文摘
随着网络和多媒体技术的发展,越来越多的视频数据充斥着互联网,对视频进行有效的管理,尽可能排除其中的重复内容已经成为一项很重要的工作。基于这种现状,设计了一套快速而有效的视频近似拷贝检索系统。不同于传统的视频近似检测方法,该系统采用深度学习的方法,使用深度卷积神经网络快速地为采样帧提取特征,使用k-d树为视频库中的特征值建立索引,从而提高相似查找的速度,最后计算输入视频与所有候选视频的相似度,并按相似度对候选视频排序输出。
关键词
近似
拷贝
检索
特征值提取
深度学习
K-D树
相似度度量
Keywords
Near-duplicate retrieval Feature extraction Deep learning K-d tree Similarity measure
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
一种支持非度量空间中近似查询的索引技术
6
作者
彭敦陆
徐文杰
霍欢
江平
机构
上海理工大学光电信息与计算机工程学院
上海宽文是风软件有限公司
出处
《计算机应用研究》
CSCD
北大核心
2014年第7期1965-1971,共7页
基金
上海浦东新区科技发展基金创新资金科技合作项目(PKJ2013-Z14)
国家自然科学基金资助项目(61003031)
上海市自然科学基金资助项目(10ZR1421100)
文摘
多媒体信息系统通常使用索引技术加快检索,现有索引技术绝大多数都是基于度量空间建立的,其中广泛应用度量空间的三角不等性。在非度量空间中,面向度量空间的索引技术难以快速而准确地完成检索任务。针对多媒体数据对象进行研究,发现其具有非度量空间的属性,在建立多媒体数据索引时,采用非度量空间中的计算方法使得所建索引更加有效。结合聚类和pivots技术,提出一种支持非度量空间中的对象索引结构——M+-tree。给出了M+-tree的建立、维护及采用M+-tree进行快速KNN检索的相关算法。实验表明,M+-tree在检索性能和检索效果上比现有的非度量空间的索引结构具有明显优势。
关键词
索引结构
非度量空间
近似检索
树结构
聚类
Keywords
index structure
non-metric space
approximate query
tree structure
clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
开放环境多分布特性的局部敏感哈希检索方法
被引量:
13
7
作者
张仕
赖会霞
肖如良
潘淼鑫
张路路
陈伟林
机构
福建师范大学计算机与网络空间安全学院
数字福建环境监测物联网实验室(福建师范大学)
福建省网络安全与密码技术重点实验室(福建师范大学)
出处
《软件学报》
EI
CSCD
北大核心
2022年第4期1200-1217,共18页
基金
国家自然科学基金(61772004)
福建省科技重大项目(2020H6011)
福建省自然科学基金(2020J01161)。
文摘
基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境下多种分布特性的基于Laplacian算子的局部敏感哈希搜索方法(LPLSH).该方法把Laplacian算子应用于数据投影的概率密度分布,找到数据投影分布的剧烈变化位置作为超平面的偏移量.从理论上证明了精简维度的哈希函数能够保持局部敏感性及低投影密度区间分割的有效性,分析了利用Laplacian算子计算的二阶导数对超平面偏移量设置的指导意义.与其他8种方法对比,LPLSH算法的F1值是其他方法最优值的0.8倍-5倍,耗费时间也大幅减少.通过对具有多种分布特性数据集上的实验验证,结果表明:LPLSH方法能够同时兼顾效率、精度和召回率,可满足开放环境下多分布特性的大规模高维检索的鲁棒性需求.
关键词
开放环境
近似
近邻
检索
数据多分布特性
局部敏感哈希
数据
检索
Keywords
open environment
nearest neighbor search
data multiple distributed characteristics
locality-sensitive hashing
data retrieval
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于随机森林的哈希检索算法
被引量:
6
8
作者
花强
郭欣欣
张峰
董春茹
机构
河北大学河北省机器学习与计算智能重点实验室
出处
《计算机科学与探索》
CSCD
北大核心
2019年第7期1174-1183,共10页
基金
河北省自然科学基金面上项目Nos.F2018201115,F2018201096
河北省教育厅青年基金No.QN2017019
河北省教育厅科学技术研究重点项目No.ZD2019021~~
文摘
从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻算法效率降低,而近似最近邻算法发挥了越来越重要的作用。其中哈希算法以其在存储空间和计算时间上的优势受到了广泛关注。提出了一种基于随机森林的哈希算法。该算法通过构建随机森林,将原始空间的样本映射为海明空间的二进制哈希码,并在哈希空间上定义了顺序敏感的海明距离,以最大程度保持数据在原空间的近邻关系不变。由于随机森林中不同决策树所使用的特征空间和学习过程是独立的,可以以增量的方式灵活地确定哈希码的长度。此外基于随机森林的哈希编码算法天然适合并行部署,从而可以大大提高算法速度。最后,在MNIST和CIFAR-10数据集对所提算法进行了实验验证,结果表明了算法的有效性和出色性能。
关键词
近似
近邻
检索
(ANNS)
哈希编码
随机森林
顺序敏感的海明距离
Keywords
approximate nearest neighbor search (ANNS)
Hashing code
random forest
order-sensitive Hamming distance
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于卷积神经网络和监督核哈希的图像检索方法
被引量:
37
9
作者
柯圣财
赵永威
李弼程
彭天强
机构
解放军信息工程大学信息系统工程学院
武警工程大学电子技术系
河南工程学院计算机学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2017年第1期157-163,共7页
基金
国家自然科学基金(No.60872142
No.61301232)
文摘
当前主流的图像检索方法采用的视觉特征,缺乏自主学习能力,导致其图像表达能力不强,此外,传统的特征索引方法检索效率较低,难以适用于大规模图像数据.针对这些问题,本文提出了一种基于卷积神经网络和监督核哈希的图像检索方法.首先,利用卷积神经网络的学习能力挖掘训练图像内容的内在隐含关系,提取图像深层特征,增强特征的视觉表达能力和区分性;然后,利用监督核哈希方法对高维图像深层特征进行监督学习,并将高维特征映射到低维汉明空间中,生成紧致的哈希码;最后,在低维汉明空间中完成对大规模图像数据的有效检索.在Image Net-1000和Caltech-256数据集上的实验结果表明,本文方法能够有效地增强图像特征的表达能力,提高图像检索效率,优于当前主流方法.
关键词
深度学习
图像
检索
卷积神经网络
近似
近邻
检索
监督核哈希
Keywords
deep learning
image retrieval
convolutional neural network
approximate nearest neighbor
kernel-based supervised Hashing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
高维空间近邻检索的双层组合量化GPU加速算法
被引量:
5
10
作者
邓理睿
包涵
陈靓
全成斌
赵有健
机构
清华大学计算机科学与技术系
中国石油勘探开发研究院
出处
《小型微型计算机系统》
CSCD
北大核心
2019年第2期390-394,共5页
基金
国家自然科学基金项目(61472210
61233007)资助
文摘
在大规模视频、图像、文本检索等许多实际应用中,高维空间内海量数据的索引及近邻检索一直是难点和关键问题之一.传统的K-D树等树形索引方法在高维空间中容易陷入"维度灾难",而主流的哈希散列方法(如局部敏感哈希)空间复杂度较高,在大规模数据下难以应用.本文总结了近年来基于向量量化的检索算法的相关研究,提出了一种基于GPU优化的高维数据近似近邻检索算法,在组合量化算法的基础上融合双层索引树结构与局部子空间最优化思想,在提高算法准确率的同时针对GPU模型优化算法,极大改善了检索性能,在单张GPU上实现了十亿量级高维数据的高效近似近邻检索.
关键词
近似
近邻
检索
组合量化
GPU
高维索引
Keywords
approximate nearest neighbor
composite quantization
GPU
high-dimension indexing
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
量化编码的分层可通航小世界图算法
被引量:
1
11
作者
李秋珍
白兴强
李立夏
王赢
机构
武汉数字工程研究所
华中科技大学计算机科学与技术学院
出处
《计算机工程与科学》
CSCD
北大核心
2019年第4期618-625,共8页
基金
军委装备发展部科研订购局"十三五"装备预研领域基金(61401320501)
文摘
随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界图HNSW检索算法在多个公开数据集取得了最佳的性能表现,但该算法存在内存开销大的问题。而基于量化编码的检索算法能够压缩数据集向量,大幅度降低内存占用。将量化编码和分层可通航小世界图算法结合,提出了2种基于量化编码改进的HNSW算法,分别是使用标量量化编码向量的HNSWSQ算法和使用乘积量化编码向量的HNSWPQ算法,2种算法使用不同的量化策略存储原始向量编码,以降低内存开销,再通过HNSW算法建立索引达到缩短检索耗时的目的。其中HNSWSQ算法在多个数据集上获得了与HNSW算法相近的查全率和平均检索耗时,而内存开销大幅降低。实验结果表明,HNSWSQ算法在SIFT-1M和GIST-1M数据集上的内存开销比HNSW算法分别降低了45.1%和70.4%。
关键词
近似
最近邻
检索
分层可通航小世界图算法
乘积量化
标量量化
相似性搜索
高维数据索引
Keywords
approximate nearest neighbor search
hierarchical navigable small world graph algorithm
product quantization
scalar quantization
similarity search
indexing of high-dimensional data
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
近似检索的一些处理方法
杨宪泽
《计算机工程》
EI
CAS
CSCD
北大核心
1998
11
在线阅读
下载PDF
职称材料
2
结合对象属性与近似检索的协同过滤算法
陈乐
余粟
《小型微型计算机系统》
CSCD
北大核心
2021
1
在线阅读
下载PDF
职称材料
3
面向大规模图像检索的哈希学习综述
张雪凝
刘兴波
宋井宽
聂秀山
王少华
尹义龙
《软件学报》
北大核心
2025
1
在线阅读
下载PDF
职称材料
4
基于相对编辑相似度的近似重复视频检索和定位
赵清杰
王浩
刘浩
张聪
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2018
6
在线阅读
下载PDF
职称材料
5
基于深度学习的视频近似拷贝检索
冯兆华
朱允斌
李卫强
《计算机应用与软件》
北大核心
2018
2
在线阅读
下载PDF
职称材料
6
一种支持非度量空间中近似查询的索引技术
彭敦陆
徐文杰
霍欢
江平
《计算机应用研究》
CSCD
北大核心
2014
0
在线阅读
下载PDF
职称材料
7
开放环境多分布特性的局部敏感哈希检索方法
张仕
赖会霞
肖如良
潘淼鑫
张路路
陈伟林
《软件学报》
EI
CSCD
北大核心
2022
13
在线阅读
下载PDF
职称材料
8
基于随机森林的哈希检索算法
花强
郭欣欣
张峰
董春茹
《计算机科学与探索》
CSCD
北大核心
2019
6
在线阅读
下载PDF
职称材料
9
基于卷积神经网络和监督核哈希的图像检索方法
柯圣财
赵永威
李弼程
彭天强
《电子学报》
EI
CAS
CSCD
北大核心
2017
37
在线阅读
下载PDF
职称材料
10
高维空间近邻检索的双层组合量化GPU加速算法
邓理睿
包涵
陈靓
全成斌
赵有健
《小型微型计算机系统》
CSCD
北大核心
2019
5
在线阅读
下载PDF
职称材料
11
量化编码的分层可通航小世界图算法
李秋珍
白兴强
李立夏
王赢
《计算机工程与科学》
CSCD
北大核心
2019
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部