期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
相似索引:适用于重复数据删除的二级索引 被引量:1
1
作者 张志珂 蒋泽军 +1 位作者 蔡小斌 彭成章 《计算机应用研究》 CSCD 北大核心 2013年第12期3614-3617,共4页
由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除率。为了改进EB,提出了相似索引。它把相似哈希作为文件的特征,是一种适用于以小文件为主的数据负载的重... 由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除率。为了改进EB,提出了相似索引。它把相似哈希作为文件的特征,是一种适用于以小文件为主的数据负载的重复数据删除的二级索引。实验结果表明,相似索引的重复数据删除率比EB高24.8%;相似索引的内存使用量仅仅是EB的0.265%。与EB相比,相似索引需要更少的存储使用量和内存使用量。 展开更多
关键词 重复数据删除 相似哈希 相似索引 块查找磁盘瓶颈问题 二级索引
在线阅读 下载PDF
半结构化数据相似搜索的索引技术研究 被引量:11
2
作者 杨建武 陈晓鸥 《计算机学报》 EI CSCD 北大核心 2002年第11期1219-1226,共8页
为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树——CSS-树以及基于CSS-树的相似搜索与动态更新的算法.CSS-树借鉴SS+-树基于聚类进行节点组织与分裂的基本思想... 为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树——CSS-树以及基于CSS-树的相似搜索与动态更新的算法.CSS-树借鉴SS+-树基于聚类进行节点组织与分裂的基本思想,避免了根据坐标维进行分裂时所要求的维不相关性,同时在节点组织、分裂算法和搜索算法等方面进行了改进,提出了新的搜索剪枝策略.实验表明,该结构及算法对海量半结构化数据相似搜索的效率明显优于传统算法. 展开更多
关键词 半结构化数据 相似搜索 索引 相似索引 聚类 数据挖掘 数据库 多路平衡树
在线阅读 下载PDF
逐维聚类的相似度索引算法 被引量:5
3
作者 汪祖媛 庄镇泉 王煦法 《计算机研究与发展》 EI CSCD 北大核心 2004年第6期1003-1009,共7页
随着多媒体信息技术的迅速发展 ,多维度索引技术在图像、视频等可视信息的存储、检索方面成为一个重要的研究领域 针对“维数危机”难题 ,提出逐维聚类相似度索引算法 该算法根据数据集的分布特性 ,对特征矢量的每一维进行聚类 算法... 随着多媒体信息技术的迅速发展 ,多维度索引技术在图像、视频等可视信息的存储、检索方面成为一个重要的研究领域 针对“维数危机”难题 ,提出逐维聚类相似度索引算法 该算法根据数据集的分布特性 ,对特征矢量的每一维进行聚类 算法在实现检索时可以逐步滤除与查询矢量不相似的数据集 ,缩小检索范围 ,进而提高了检索速度 实验结果表明 ,逐维聚类算法适用于基于相似度的高维数据矢量检索和查询 ,是一种简单。 展开更多
关键词 逐维聚类 相似索引 最邻近查询
在线阅读 下载PDF
结构相似度索引耦合最优稀疏表示的大规模损坏图像动态修复 被引量:11
4
作者 耿卫江 《科学技术与工程》 北大核心 2014年第25期107-114,共8页
当前的图像修复算法在处理小面积损坏图像时,可取得较佳的视觉质量;但难以用于高对比度边缘和高频分量的大面积损坏图像的修复,存在明显的模糊效应与块效应,使得修复质量较差。对此,提出了结构相似度索引耦合优化稀疏表示的大规模损坏... 当前的图像修复算法在处理小面积损坏图像时,可取得较佳的视觉质量;但难以用于高对比度边缘和高频分量的大面积损坏图像的修复,存在明显的模糊效应与块效应,使得修复质量较差。对此,提出了结构相似度索引耦合优化稀疏表示的大规模损坏图像动态修复机制。基于数据度与置信度构造图像块先验模型,提取损坏图像的已知块;再引入K-SVD算法和拉格朗日乘数机制,构造最优字典矩阵,优化稀疏表示,以重构目标图像损坏区域;并设计结构相似度索引与动态更新机制,估算稀疏表示系数,并动态更新字典矩阵,输出修复图像。最后测试了其机制性能。结果表明:与当前图像修复算法相比,在大规模损坏图像与高对比度边缘图像修复中,具有更好的修复效果、更高的相似度,显著消除了模糊效应与块效应。 展开更多
关键词 结构相似索引 优化稀疏表示 最优字典矩阵 块先验 图像动态修复
在线阅读 下载PDF
基于度量空间高维索引结构VP-tree及MVP-tree的图像检索 被引量:1
5
作者 王志强 甘国辉 程起敏 《计算机工程与应用》 CSCD 北大核心 2004年第36期41-44,150,共5页
首先分析了度量空间高维索引结构的研究意义及具体应用,然后在仔细探讨典型的基于距离的度量空间高维索引结构VP-tree及其变种MVP-tree的基本思想、构造和搜索算法的基础上,通过具体的实验对其在图像检索中的性能进行了全面的分析,给出... 首先分析了度量空间高维索引结构的研究意义及具体应用,然后在仔细探讨典型的基于距离的度量空间高维索引结构VP-tree及其变种MVP-tree的基本思想、构造和搜索算法的基础上,通过具体的实验对其在图像检索中的性能进行了全面的分析,给出了通过实验得到的结论,最后指出了有待进一步研究的方向。 展开更多
关键词 度量空间 高维索引结构 相似索引 VP-tree MVP-tree 基于内容的图像检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部