-
题名大规模数据检索中基于哈希编码的量化技术综述
被引量:1
- 1
-
-
作者
任艳多
-
机构
宁波大学
-
出处
《数据通信》
2018年第2期45-48,54,共5页
-
文摘
随着信息技术的飞速发展,各行业的数据呈爆炸式增长。大规模数据的检索与分析是大数据研究的关键内容之一。量化技术是基于哈希编码的数据检索算法的一个研究热点。探讨了基于哈希编码的量化技术在数据检索中的目标,介绍了四类典型的基于哈希编码的量化技术,即基于超平面的量化、基于笛卡尔积的量化、基于深度学习的量化以及基于优化编码的量化。阐述了每类量化技术的特点,对基于哈希编码的量化领域未来的研究方向提出了一些思考和建议。
-
关键词
大规模数据检索
哈希编码
量化
保相似性
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向大规模数据检索的哈希学习研究进展
被引量:1
- 2
-
-
作者
任艳多
胡伟
孙瑶
-
机构
宁波大学信息科学与工程学院
-
出处
《无线通信技术》
2017年第4期21-25,共5页
-
文摘
随着机器学习、深度学习等人工智能技术的发展,基于哈希的大规模数据检索有了新的发展。哈希学习是机器学习方法在传统哈希检索领域的应用。探讨了哈希学习的主要研究内容,即哈希函数、相似度量以及损失函数。根据度量阶段的不同,将现有的哈希学习算法分为三类:基于主成分分析的哈希学习、基于聚类的哈希学习以及基于神经网络的哈希学习。阐述了每类哈希学习算法的特点,对哈希学习未来的研究方向提出了一些思考和建议。
-
关键词
大规模数据检索
哈希学习
保相似性
-
Keywords
large-scale data retrieval
learning to hash
similarity preserving
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名深度学习哈希研究与发展
被引量:3
- 3
-
-
作者
孙瑶
-
机构
宁波大学信息科学与工程学院
-
出处
《数据通信》
2018年第2期49-54,共6页
-
文摘
在很多实际应用中,如何查找到最相似的近邻数据是计算机学科中的一个基础研究内容,而由于数据集规模的迅速增长,直接比较查询的计算复杂度极高,所需要的存储空间也极大,因此基于哈希技术的近似最近邻查询成为了一个研究热点。哈希学习技术通过将数据映射成二进制编码的形式,显著减少了数据的存储开销以及计算复杂度,有效提高了大规模数据集下的检索效率。近年来,由于深度学习在特征提取上优异的表现,基于深度学习的哈希方法在数据检索中取得了显著的进展。本文分析了深度学习哈希的主要方法和研究进展,对深度学习哈希进行了介绍,并提出了其未来的研究方向。
-
关键词
大规模数据检索
近似最近邻查询
深度学习哈希
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-