期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于不相似性度量优化的密度峰值聚类算法 被引量:30
1
作者 丁世飞 徐晓 王艳茹 《软件学报》 EI CSCD 北大核心 2020年第11期3321-3333,共13页
密度峰值聚类(clustering by fast search and find of density peaks,简称DPC)是一种基于局部密度和相对距离属性快速寻找聚类中心的有效算法.DPC通过决策图寻找密度峰值作为聚类中心,不需要提前指定类簇数,并可以得到任意形状的簇聚类... 密度峰值聚类(clustering by fast search and find of density peaks,简称DPC)是一种基于局部密度和相对距离属性快速寻找聚类中心的有效算法.DPC通过决策图寻找密度峰值作为聚类中心,不需要提前指定类簇数,并可以得到任意形状的簇聚类.但局部密度和相对距离的计算都只是简单依赖基于距离度量的相似度矩阵,所以在复杂数据上DPC聚类结果不尽如人意,特别是当数据分布不均匀、数据维度较高时.另外,DPC算法中局部密度的计算没有统一的度量,根据不同的数据集需要选择不同的度量方式.第三,截断距离dc的度量只考虑数据的全局分布,忽略了数据的局部信息,所以dc的改变会影响聚类的结果,尤其是在小样本数据集上.针对这些弊端,提出一种基于不相似性度量优化的密度峰值聚类算法(optimized density peaks clustering algorithm based on dissimilarity measure,简称DDPC),引入基于块的不相似性度量方法计算相似度矩阵,并基于新的相似度矩阵计算样本的K近邻信息,然后基于样本的K近邻信息重新定义局部密度的度量方法.经典数据集的实验结果表明,基于不相似性度量优化的密度峰值聚类算法优于DPC的优化算法FKNN-DPC和DPC-KNN,可以在密度不均匀以及维度较高的数据集上得到满意的结果;同时统一了局部密度的度量方式,避免了传统DPC算法中截断距离dc对聚类结果的影响. 展开更多
关键词 密度峰值聚类 局部密度 决策图 不相似性度量 密度不均匀
在线阅读 下载PDF
一种用于图像检索的多层语义二值描述符 被引量:5
2
作者 吴泽斌 于俊清 +1 位作者 何云峰 管涛 《计算机学报》 EI CSCD 北大核心 2020年第9期1641-1655,共15页
随着图像数据的爆炸性增长,基于内容的图像检索引起了大量的关注.图像检索系统的性能很大程度上是由描述符决定的.有很多传统的描述符先后被提出,但检索的准确率都不太理想.随着深度学习的发展,利用卷积神经网络(Convolutional Neural N... 随着图像数据的爆炸性增长,基于内容的图像检索引起了大量的关注.图像检索系统的性能很大程度上是由描述符决定的.有很多传统的描述符先后被提出,但检索的准确率都不太理想.随着深度学习的发展,利用卷积神经网络(Convolutional Neural Network,CNN)来学习占用空间小且具有较强区分力(discriminative)的图像表示逐渐兴起.卷积神经网络全连接层的特征通常为分类任务而设计,捕获的往往是高层的语义信息,难以充分有效的捕获图像的局部信息,而且维度很高.为解决全连接层特征缺乏局部信息且维度较高的问题,本文提出了一种多层语义二值描述符(Multi-level Semantic Binary Descriptor,MSBD).多层语义二值描述符通过多层语义浮点描述符构建和二值描述符学习两个步骤生成.多层语义浮点描述符由全局分支、对象分支以及显著性区域分支构成,每个分支代表一个语义层次,可以同时捕获全局特征以及显著的局部特征.二值描述符学习算法通过一个迭代的过程减少二值化过程中的量化误差以及编码中的冗余信息,在压缩描述符的同时减少区分力的损失.为了进一步提高查询的准确率,本文提出了一种不相似性度量函数.此度量函数同时包含了哈希代表的视觉语义信息以及类级别的高层概念语义信息.本文在该领域典型的数据集上对描述符进行了系统的对比实验,实验结果表明,多层语义二值描述符具有很强的区分力,查询准确率优于很多当前最先进的浮点描述符,在Oxford5K数据集上与目前最好的方法达到了相近的准确率,在Paris6K数据集上比已有的方法超过了约4.3%,在Holidays数据集上比已有方法超过了约2.1%. 展开更多
关键词 图像表示 卷积神经网络 不相似性度量 图像检索 多层语义二值描述符
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部