期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
87
篇文章
<
1
2
…
5
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于反向最近邻的密度估计聚类算法
1
作者
许梅梅
侯新民
《计算机工程与应用》
北大核心
2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类...
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。
展开更多
关键词
反向
最近
邻
局部密度
密度
聚
类
算法
子簇融合
在线阅读
下载PDF
职称材料
基于共享最近邻的自适应密度峰值聚类算法
被引量:
1
2
作者
王心耕
杜韬
+2 位作者
周劲
陈迪
仵匀政
《计算机科学》
CSCD
北大核心
2024年第8期97-105,共9页
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分...
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。
展开更多
关键词
共享
最近
邻
密度峰值
聚
类
分配策略
聚
类
中心
密度衰减
在线阅读
下载PDF
职称材料
融合转移概率矩阵的多阶最近邻图聚类算法
3
作者
徐童童
解滨
+1 位作者
张春昊
张喜梅
《计算机应用》
CSCD
北大核心
2024年第5期1527-1538,共12页
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本...
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。
展开更多
关键词
共享
近
邻
趋密性
转移概率
多阶
最近
邻
分层
聚
类
在线阅读
下载PDF
职称材料
改进的共享最近邻聚类算法
被引量:
3
4
作者
李霞
蒋盛益
《计算机工程与应用》
CSCD
北大核心
2011年第8期138-142,共5页
聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2...
聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2)没有明确给出参数阈值的简单指导性操作方法;(3)只能处理数值型属性数据集。对共享最近邻算法进行改进,使其能够处理混合属性数据集,并给出参数阈值的简单选择方法,改进后算法运行时间与数据集大小成近似线性关系,适用于大规模高维数据集。在真实数据集和人造数据集上的实验结果表明,提出的改进算法是有效可行的。
展开更多
关键词
共享
最近
邻
聚
类
算法
一趟
聚
类
算法
大规模数据集
在线阅读
下载PDF
职称材料
基于共享最近邻的密度自适应邻域谱聚类算法
被引量:
8
5
作者
葛君伟
杨广欣
《计算机工程》
CAS
CSCD
北大核心
2021年第8期116-123,共8页
在谱聚类算法没有先验信息的情况下,对于具有复杂形状和不同密度变化的数据集很难构建合适的相似图,且基于欧氏距离的高斯核函数的相似性度量忽略了全局一致性。针对该问题,提出一种基于共享最近邻的密度自适应邻域谱聚类算法(SC-DANSN...
在谱聚类算法没有先验信息的情况下,对于具有复杂形状和不同密度变化的数据集很难构建合适的相似图,且基于欧氏距离的高斯核函数的相似性度量忽略了全局一致性。针对该问题,提出一种基于共享最近邻的密度自适应邻域谱聚类算法(SC-DANSN)。通过一种无参数的密度自适应邻域构建方法构建无向图,将共享最近邻作为衡量样本之间的相似性度量进而消除参数对构建相似图的影响,体现全局和局部的一致性。实验结果表明,SC-DANSN算法相比K-means算法和基于K最近邻的谱聚类算法(SC-KNN)具有更高的聚类精度,同时相比SC-KNN算法对参数的选取敏感性更低。
展开更多
关键词
谱
聚
类
相似性矩阵
密度自适应
邻
域
共享
最近
邻
K
最近
邻
在线阅读
下载PDF
职称材料
结合自然和共享最近邻的密度峰值聚类算法
被引量:
7
6
作者
柏锷湘
罗可
罗潇
《计算机科学与探索》
CSCD
北大核心
2021年第5期931-940,共10页
基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳。针对这些问题,提出一种密度峰值聚类改进算法。该算法结合了自然和共享最...
基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳。针对这些问题,提出一种密度峰值聚类改进算法。该算法结合了自然和共享最近邻算法,重新定义了截断距离和局部密度的计算方法,并且算法融合了候选聚类中心计算概念,通过算法选出不同的候选聚类中心,然后以这些候选中心为新的数据集,再次开始密度峰值聚类,最后将剩余的点分配到所对应的候选中心点所在类簇中。改进的算法在合成数据集和UCI数据集上进行验证,并与K-means、DBSCAN和DPC算法进行比较。实验结果表明,提出的算法在性能方面有明显提升。
展开更多
关键词
密度峰值
聚
类
算法
自然
最近
邻
共享
最近
邻
在线阅读
下载PDF
职称材料
罚处共享最近邻密度峰聚类算法
被引量:
1
7
作者
高润峰
苏一丹
覃华
《计算机工程与设计》
北大核心
2021年第12期3407-3414,共8页
为解决传统密度峰聚类算法容易忽略低密度簇中心以及难以自动选择聚类中心的问题,提出罚处共享最近邻密度峰聚类算法。设计罚处系数,减少高密度簇中非中心点的共享最近邻局部密度值,降低低密度簇中心点被忽视的机率;采用迭代阈值法实现...
为解决传统密度峰聚类算法容易忽略低密度簇中心以及难以自动选择聚类中心的问题,提出罚处共享最近邻密度峰聚类算法。设计罚处系数,减少高密度簇中非中心点的共享最近邻局部密度值,降低低密度簇中心点被忽视的机率;采用迭代阈值法实现簇中心点的自动选择。在人工数据集、UCI真实数据集以及图像数据集上进行仿真实验,其结果表明,该算法能找到数据集的簇中心和簇数目,聚类精度优于相比较的其它算法,该算法是可行的、有效的。
展开更多
关键词
密度峰
聚
类
算法
共享
最近
邻
局部密度
簇中心点
罚处系数
迭代阈值法
在线阅读
下载PDF
职称材料
基于注意力机制的不完备多视图聚类算法
被引量:
2
8
作者
杨成昊
胡节
+1 位作者
王红军
彭博
《计算机应用》
CSCD
北大核心
2024年第12期3784-3789,共6页
针对传统深度不完备多视图聚类算法中补全缺失视图数据的不确定性、嵌入学习鲁棒性的缺乏和模型泛化性低的问题,提出基于注意力机制的不完备多视图聚类算法(IMVCAM)。首先,通过K最近邻(KNN)算法补全了视图中缺失的数据,使训练数据具有...
针对传统深度不完备多视图聚类算法中补全缺失视图数据的不确定性、嵌入学习鲁棒性的缺乏和模型泛化性低的问题,提出基于注意力机制的不完备多视图聚类算法(IMVCAM)。首先,通过K最近邻(KNN)算法补全了视图中缺失的数据,使训练数据具有互补性;其次,经过线性编码层后,将获得的嵌入通过注意力层,以提高嵌入的质量;最后,对每个视图训练得到的嵌入使用k均值聚类算法进行聚类,而视图的权重通过皮尔逊相关系数确定。在5个经典的数据集上的实验结果表明,在Fashion数据集上,IMVCAM取得最优的结果,相较于次优的深度安全不完整多视图聚类(DSIMVC)算法,在数据缺失率为0.1、0.3的情况下,IMVCAM的聚类准确率分别提升了2.85、4.35个百分点;此外,在Caltech101-20数据集上,IMVCAM相较于次优的基于自注意力融合的不完整多视图聚类算法(IMVCSAF),在数据缺失率为0.1、0.3的情况下的聚类准确率分别提升了7.68、3.48个百分点。所提算法能够有效应对多视图数据的不完备性和模型泛化性问题。
展开更多
关键词
不完备多视
图
聚
类
K
最近
邻
算法
注意力机制
K均值
聚
类
算法
皮尔逊相关系数
在线阅读
下载PDF
职称材料
一种改进的最近邻聚类学习算法
被引量:
5
9
作者
李杰星
章云
符曦
《控制理论与应用》
EI
CAS
CSCD
北大核心
2000年第5期735-738,共4页
提出了一种自适应模糊逻辑系统 (AFLS)的改进自适应学习算法 ,该算法将无导师学习算法与基于梯度信息的寻优学习算法相结和 。
关键词
模糊神经网络
非线性系统
最近
邻
聚
类
学习
算法
在线阅读
下载PDF
职称材料
动态最近邻聚类算法的优化研究
被引量:
5
10
作者
储岳中
徐波
《计算机工程与设计》
CSCD
北大核心
2011年第5期1687-1690,共4页
针对最近邻聚类算法对聚类半径敏感、不易获得最优解的问题,提出了基于贝叶斯信息测度BIC(Bayesianinformationcriterion)的优化方法。通过DBSCAN算法对初始数据集进行预处理,去除噪声数据。在参数空间内逐步调整聚类半径,利用最近邻聚...
针对最近邻聚类算法对聚类半径敏感、不易获得最优解的问题,提出了基于贝叶斯信息测度BIC(Bayesianinformationcriterion)的优化方法。通过DBSCAN算法对初始数据集进行预处理,去除噪声数据。在参数空间内逐步调整聚类半径,利用最近邻聚类算法对数据集进行聚类,并计算每次聚类结果的贝叶斯信息测度值。比较各次聚类结果的贝叶斯信息测度值,最大贝叶斯信息测度值对应的聚类即为最优聚类结果。实验结果表明,优化的最近邻聚类算法很好地解决了合适的聚类半径选取问题。
展开更多
关键词
数据挖掘
密度
聚
类
算法
贝叶斯信息测度
最近
邻
聚
类
优化
在线阅读
下载PDF
职称材料
基于AIC准则的最近邻聚类模型的优化算法
被引量:
13
11
作者
秦宣云
《系统工程与电子技术》
EI
CSCD
北大核心
2005年第2期257-259,共3页
聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出...
聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出了理论分析。通过实例仿真,验证了本方法的实用性和正确性。
展开更多
关键词
聚
类
分析
AIC准则
最近
邻
聚
类
算法
在线阅读
下载PDF
职称材料
模糊逻辑系统的最近邻聚类学习算法
12
作者
李青茹
王培峰
尹志宇
《组合机床与自动化加工技术》
北大核心
2004年第1期65-66,共2页
文章先提出了一种最优模糊逻辑系统 ,它能使样本中所有的输入—输出数据对都拟合到任意给定的精度 (在此意义上的最优 ) ;然后将这种最优模糊逻辑系统推广到大样本问题 ,为此 ,将样本数据用最近邻聚类算法进行分组 ,将每一组数据 (一个...
文章先提出了一种最优模糊逻辑系统 ,它能使样本中所有的输入—输出数据对都拟合到任意给定的精度 (在此意义上的最优 ) ;然后将这种最优模糊逻辑系统推广到大样本问题 ,为此 ,将样本数据用最近邻聚类算法进行分组 ,将每一组数据 (一个聚类 )视为一个数据对 ,用最优模糊逻辑系统来进行拟合。还给出了学习算法并进行了仿真实验 。
展开更多
关键词
模糊逻辑系统
最近
邻
聚
类
输入-输出数据对
学习
算法
精度
在线阅读
下载PDF
职称材料
基于自然最近邻相似图的谱聚类
被引量:
8
13
作者
刘友超
张曦煌
《计算机应用研究》
CSCD
北大核心
2020年第1期30-33,39,共5页
传统谱聚类算法经常在处理一些结构复杂的数据集时效果不太理想,并且其相似度矩阵构造时参数的选取往往需要依靠多次实验及个人经验。在这种情况下,提出一种基于自然最近邻相似图的谱聚类(NSG-SC)算法。自然最近邻是一种新颖的最近邻概...
传统谱聚类算法经常在处理一些结构复杂的数据集时效果不太理想,并且其相似度矩阵构造时参数的选取往往需要依靠多次实验及个人经验。在这种情况下,提出一种基于自然最近邻相似图的谱聚类(NSG-SC)算法。自然最近邻是一种新颖的最近邻概念,可以有效地避免K最近邻以及ε-最近邻方法需要人为设置参数的缺点。该算法构造相似度矩阵时依靠数据集自身的特性进行搜索,避免了参数选取不当以及离散点所带来的影响,更加真实地反映了数据集的结构关系。实验结果表明,提出的NSG-SC算法具有可行性和有效性。
展开更多
关键词
谱
聚
类
自然
最近
邻
相似
图
相似度矩阵
在线阅读
下载PDF
职称材料
面向海量数据的改进最近邻优先吸收聚类算法
被引量:
5
14
作者
宁可
孙同晶
徐洁洁
《计算机工程》
CAS
CSCD
北大核心
2018年第4期35-40,共6页
针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,...
针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,与K-means算法和最近邻优先吸收聚类算法相比,改进算法在保证聚类质量的基础上具有较快的运行速度,并适用于海量数据的聚类分析。
展开更多
关键词
海量数据
聚
类
MAPREDUCE框架
最近
邻
优先吸收
聚
类
算法
Canopy
算法
并行化
在线阅读
下载PDF
职称材料
公理化模糊共享近邻自适应谱聚类算法
被引量:
12
15
作者
储德润
周治平
《智能系统学报》
CSCD
北大核心
2019年第5期897-904,共8页
针对传统的谱聚类算法通常利用高斯核函数作为相似性度量,且单纯以距离决定相似性不能充分表现原始数据中固有的模糊性、不确定性和复杂性,导致聚类性能降低的问题。提出了一种公理化模糊共享近邻自适应谱聚类算法,首先结合公理化模糊...
针对传统的谱聚类算法通常利用高斯核函数作为相似性度量,且单纯以距离决定相似性不能充分表现原始数据中固有的模糊性、不确定性和复杂性,导致聚类性能降低的问题。提出了一种公理化模糊共享近邻自适应谱聚类算法,首先结合公理化模糊集理论提出了一种模糊相似性度量方法,利用识别特征来衡量更合适的数据成对相似性,然后采用共享近邻的方法发现密集区域样本点分布的结构和密度信息,并且根据每个点所处领域的稠密程度自动调节参数σ,从而生成更强大的亲和矩阵,进一步提高聚类准确率。实验表明,相较于距离谱聚类、自适应谱聚类、模糊聚类方法和地标点谱聚类,所提算法有着更好的聚类性能。
展开更多
关键词
机器学习
数据挖掘
聚
类
分析
模糊
聚
类
谱
聚
类
公理化模糊集理论
共享
最近
邻
尺度参数
在线阅读
下载PDF
职称材料
共享近邻紧密度的增量式谱聚类算法
被引量:
3
16
作者
赵萌萌
王士同
《计算机科学与探索》
CSCD
北大核心
2020年第6期996-1004,共9页
现有的基于共享近邻紧密度的谱聚类算法由于能很好地探索出数据点之间的潜在相似性关系,对未能完全分离的数据集具有健壮性,受到了越来越多的关注。但是,在运行时间和内存需求方面,它要花费的代价仍然十分昂贵,这使得其聚类处理能力不...
现有的基于共享近邻紧密度的谱聚类算法由于能很好地探索出数据点之间的潜在相似性关系,对未能完全分离的数据集具有健壮性,受到了越来越多的关注。但是,在运行时间和内存需求方面,它要花费的代价仍然十分昂贵,这使得其聚类处理能力不太高效,具有运行速度较慢,运行时间过长,面对大数据集时算法失效等缺点,因此该算法对于大规模数据集来说是不切实际的。为了克服这些缺点,提出了一种它的增量版本。该算法的思想是先将数据集分解为若干子集,然后以增量的方式在每个子集上运行,从而保证其具有良好的聚类性能。通过对人工数据集和仿真数据集进行大量的实验验证了该谱聚类算法的有效性。同时,该算法的时间消耗低,聚类精度高,且能够有效地对不断增加的数据集进行聚类。
展开更多
关键词
谱
聚
类
共享
最近
邻
增量式
大规模数据
在线阅读
下载PDF
职称材料
基于模糊最近邻的高维数据聚类
被引量:
5
17
作者
刘纪平
汪宏斌
+1 位作者
汪诚波
周洞汝
《小型微型计算机系统》
CSCD
北大核心
2005年第2期261-263,共3页
提出一种基于模糊最近邻的聚类算法 (简称 FNNC算法 ) .FNNC算法通过加权共享最近邻图来形成簇 ,而且仅仅使用对象图中一些有用的连接 .本文通过实验验证了 FNNC算法在高维数据聚类中的有效性 .
关键词
模糊
最近
邻
聚
类
共享
最近
邻
聚
类
相似度量
密度测量
在线阅读
下载PDF
职称材料
K近邻和加权相似性的密度峰值聚类算法
被引量:
21
18
作者
赵嘉
陈磊
+2 位作者
吴润秀
张波
韩龙哲
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022年第12期2349-2357,共9页
密度峰值聚类算法的局部密度定义未考虑密度分布不均数据类簇间的样本密度差异影响,易导致误选类簇中心;其分配策略依据欧氏距离通过密度峰值进行链式分配,而流形数据通常有较多样本距离其密度峰值较远,导致大量本应属于同一个类簇的样...
密度峰值聚类算法的局部密度定义未考虑密度分布不均数据类簇间的样本密度差异影响,易导致误选类簇中心;其分配策略依据欧氏距离通过密度峰值进行链式分配,而流形数据通常有较多样本距离其密度峰值较远,导致大量本应属于同一个类簇的样本被错误分配给其他类簇,致使聚类精度不高.鉴于此,本文提出了一种K近邻和加权相似性的密度峰值聚类算法.该算法基于样本的K近邻信息重新定义了样本局部密度,此定义方式可以调节样本局部密度的大小,能够准确找到密度峰值;采用样本的共享最近邻及自然最近邻信息定义样本间的相似性,摒弃了欧氏距离对分配策略的影响,避免了样本分配策略产生的错误连带效应.流形及密度分布不均数据集上的对比实验表明,本文算法能准确找到疏密程度相差较大数据集的密度峰值,避免了流形数据的分配错误连带效应,得到了满意的聚类效果;同时在真实数据集上的聚类效果也十分优秀.
展开更多
关键词
密度峰值
聚
类
局部密度
K近
邻
共享
最近
邻
自然
最近
邻
在线阅读
下载PDF
职称材料
基于密度峰值和近邻优化的聚类算法
被引量:
7
19
作者
何云斌
董恒
+1 位作者
万静
李松
《计算机科学与探索》
CSCD
北大核心
2020年第4期554-565,共12页
针对密度峰值算法在选取聚类中心时的时间复杂度过高,需要人工选择截断距离并且处理流形数据时有可能出现多个密度峰值,导致聚类准确率下降等问题,提出一种新的密度峰值聚类算法,从聚类中心选择、离群点筛选、数据点分配三方面进行讨论...
针对密度峰值算法在选取聚类中心时的时间复杂度过高,需要人工选择截断距离并且处理流形数据时有可能出现多个密度峰值,导致聚类准确率下降等问题,提出一种新的密度峰值聚类算法,从聚类中心选择、离群点筛选、数据点分配三方面进行讨论和分析,并给出相应的聚类算法。在聚类中心的选择上采取KNN的思想计算数据点的密度,离群点的筛选和剪枝以及数据点分配则利用Voronoi图的性质,结合数据点的分布特征进行处理,并在最后应用层次聚类的思想以合并相似类簇,提高聚类准确率。实验结果表明:所提算法与实验对比算法相比较,具有较好的聚类效果和准确性。
展开更多
关键词
密度
聚
类
VORONOI
图
离群点
最近
邻
在线阅读
下载PDF
职称材料
密度不敏感的近邻传播聚类算法研究
被引量:
7
20
作者
冯晓磊
于洪涛
《计算机工程》
CAS
CSCD
2012年第2期159-162,共4页
近邻传播算法在非凸形、密度不均匀的数据集上很难得到理想的聚类结果。为此,基于核聚类的思想,将数据集非线性地映射到高维空间,使数据集更加分离。利用共享最近邻的相似度度量方法,提出一种密度不敏感的近邻传播算法DIS-AP,以弥补原...
近邻传播算法在非凸形、密度不均匀的数据集上很难得到理想的聚类结果。为此,基于核聚类的思想,将数据集非线性地映射到高维空间,使数据集更加分离。利用共享最近邻的相似度度量方法,提出一种密度不敏感的近邻传播算法DIS-AP,以弥补原算法易受特征集维数和密度影响的缺点,从而有效解决数据集非凸和密度不均匀问题,拓宽算法的应用范围。仿真实验结果证明,DIS-AP算法具有更好的聚类性能。
展开更多
关键词
近
邻
传播
相似度度量
核
聚
类
共享
最近
邻
聚
类
分析
密度不敏感
在线阅读
下载PDF
职称材料
题名
基于反向最近邻的密度估计聚类算法
1
作者
许梅梅
侯新民
机构
中国科学技术大学大数据学院
中国科学技术大学数学科学学院
中国科学技术大学中国科学院吴文俊数学重点实验室
合肥国家实验室
出处
《计算机工程与应用》
北大核心
2025年第1期165-173,共9页
基金
国家自然科学基金(12071453)
量子通信与量子计算机重大项目(2021ZD0302902)。
文摘
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。
关键词
反向
最近
邻
局部密度
密度
聚
类
算法
子簇融合
Keywords
reverse nearest neighbor
local density
density clustering algorithm
subcluster fusion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于共享最近邻的自适应密度峰值聚类算法
被引量:
1
2
作者
王心耕
杜韬
周劲
陈迪
仵匀政
机构
济南大学信息科学与工程学院
山东省网络环境智能计算技术重点实验室
出处
《计算机科学》
CSCD
北大核心
2024年第8期97-105,共9页
基金
国家自然科学基金(62273164)
山东省自然科学基金联合基金(ZR2020LZH009)。
文摘
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。
关键词
共享
最近
邻
密度峰值
聚
类
分配策略
聚
类
中心
密度衰减
Keywords
Shared nearest neighbor
Density peak clustering
Allocation strategy
Cluster center
Density decay
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合转移概率矩阵的多阶最近邻图聚类算法
3
作者
徐童童
解滨
张春昊
张喜梅
机构
河北师范大学计算机与网络空间安全学院
河北省网络与信息安全重点实验室(河北师范大学)
供应链大数据分析与数据安全河北省工程研究中心(河北师范大学)
出处
《计算机应用》
CSCD
北大核心
2024年第5期1527-1538,共12页
基金
国家自然科学基金资助项目(62076088)
河北师范大学研究生创新项目(XCXZZSS202317)。
文摘
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。
关键词
共享
近
邻
趋密性
转移概率
多阶
最近
邻
分层
聚
类
Keywords
shared neighbor
densification
transition probability
multi-order nearest neighbor
hierarchical clustering
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
改进的共享最近邻聚类算法
被引量:
3
4
作者
李霞
蒋盛益
机构
广东外语外贸大学思科信息学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第8期138-142,共5页
基金
国家自然科学基金(No.61070061)~~
文摘
聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2)没有明确给出参数阈值的简单指导性操作方法;(3)只能处理数值型属性数据集。对共享最近邻算法进行改进,使其能够处理混合属性数据集,并给出参数阈值的简单选择方法,改进后算法运行时间与数据集大小成近似线性关系,适用于大规模高维数据集。在真实数据集和人造数据集上的实验结果表明,提出的改进算法是有效可行的。
关键词
共享
最近
邻
聚
类
算法
一趟
聚
类
算法
大规模数据集
Keywords
shared nearest neighbor clustering algorithm one-pass clustering algorithm large dataset
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于共享最近邻的密度自适应邻域谱聚类算法
被引量:
8
5
作者
葛君伟
杨广欣
机构
重庆邮电大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第8期116-123,共8页
基金
重庆市重点产业共性关键技术创新重大主题专项(cstc2017zdcy-zdzx0046)
重庆市基础与前沿研究计划项目(cstc2017jcyjA0755)。
文摘
在谱聚类算法没有先验信息的情况下,对于具有复杂形状和不同密度变化的数据集很难构建合适的相似图,且基于欧氏距离的高斯核函数的相似性度量忽略了全局一致性。针对该问题,提出一种基于共享最近邻的密度自适应邻域谱聚类算法(SC-DANSN)。通过一种无参数的密度自适应邻域构建方法构建无向图,将共享最近邻作为衡量样本之间的相似性度量进而消除参数对构建相似图的影响,体现全局和局部的一致性。实验结果表明,SC-DANSN算法相比K-means算法和基于K最近邻的谱聚类算法(SC-KNN)具有更高的聚类精度,同时相比SC-KNN算法对参数的选取敏感性更低。
关键词
谱
聚
类
相似性矩阵
密度自适应
邻
域
共享
最近
邻
K
最近
邻
Keywords
Spectral Clustering(SC)
similarity matrix
density adaptive neighborhood
shared nearest neighbor
K Nearest Neighbor(KNN)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
结合自然和共享最近邻的密度峰值聚类算法
被引量:
7
6
作者
柏锷湘
罗可
罗潇
机构
长沙理工大学计算机与通信工程学院
国网上海电力公司
出处
《计算机科学与探索》
CSCD
北大核心
2021年第5期931-940,共10页
基金
国家自然科学基金(11671125,51707013)。
文摘
基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳。针对这些问题,提出一种密度峰值聚类改进算法。该算法结合了自然和共享最近邻算法,重新定义了截断距离和局部密度的计算方法,并且算法融合了候选聚类中心计算概念,通过算法选出不同的候选聚类中心,然后以这些候选中心为新的数据集,再次开始密度峰值聚类,最后将剩余的点分配到所对应的候选中心点所在类簇中。改进的算法在合成数据集和UCI数据集上进行验证,并与K-means、DBSCAN和DPC算法进行比较。实验结果表明,提出的算法在性能方面有明显提升。
关键词
密度峰值
聚
类
算法
自然
最近
邻
共享
最近
邻
Keywords
density peak clustering algorithm
natural nearest neighbor
shared nearest neighbor
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
罚处共享最近邻密度峰聚类算法
被引量:
1
7
作者
高润峰
苏一丹
覃华
机构
广西大学计算机与电子信息学院
出处
《计算机工程与设计》
北大核心
2021年第12期3407-3414,共8页
基金
国家自然科学基金项目(51667004、61762009)。
文摘
为解决传统密度峰聚类算法容易忽略低密度簇中心以及难以自动选择聚类中心的问题,提出罚处共享最近邻密度峰聚类算法。设计罚处系数,减少高密度簇中非中心点的共享最近邻局部密度值,降低低密度簇中心点被忽视的机率;采用迭代阈值法实现簇中心点的自动选择。在人工数据集、UCI真实数据集以及图像数据集上进行仿真实验,其结果表明,该算法能找到数据集的簇中心和簇数目,聚类精度优于相比较的其它算法,该算法是可行的、有效的。
关键词
密度峰
聚
类
算法
共享
最近
邻
局部密度
簇中心点
罚处系数
迭代阈值法
Keywords
density peak clustering algorithm
local density value of shared nearest neighbor
cluster center points
penalty coefficient
iterative threshold method
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于注意力机制的不完备多视图聚类算法
被引量:
2
8
作者
杨成昊
胡节
王红军
彭博
机构
西南交通大学计算机与人工智能学院
出处
《计算机应用》
CSCD
北大核心
2024年第12期3784-3789,共6页
基金
国家自然科学基金资助项目(62276216)
四川省重点研发计划项目(2023YFG0354)
2023年西南交通大学国际学生教育管理研究项目(23LXSGL01)。
文摘
针对传统深度不完备多视图聚类算法中补全缺失视图数据的不确定性、嵌入学习鲁棒性的缺乏和模型泛化性低的问题,提出基于注意力机制的不完备多视图聚类算法(IMVCAM)。首先,通过K最近邻(KNN)算法补全了视图中缺失的数据,使训练数据具有互补性;其次,经过线性编码层后,将获得的嵌入通过注意力层,以提高嵌入的质量;最后,对每个视图训练得到的嵌入使用k均值聚类算法进行聚类,而视图的权重通过皮尔逊相关系数确定。在5个经典的数据集上的实验结果表明,在Fashion数据集上,IMVCAM取得最优的结果,相较于次优的深度安全不完整多视图聚类(DSIMVC)算法,在数据缺失率为0.1、0.3的情况下,IMVCAM的聚类准确率分别提升了2.85、4.35个百分点;此外,在Caltech101-20数据集上,IMVCAM相较于次优的基于自注意力融合的不完整多视图聚类算法(IMVCSAF),在数据缺失率为0.1、0.3的情况下的聚类准确率分别提升了7.68、3.48个百分点。所提算法能够有效应对多视图数据的不完备性和模型泛化性问题。
关键词
不完备多视
图
聚
类
K
最近
邻
算法
注意力机制
K均值
聚
类
算法
皮尔逊相关系数
Keywords
incomplete multi-view clustering
K-Nearest Neighbors(KNN)algorithm
attention mechanism
k-means clustering algorithm
Pearson correlation coefficient
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种改进的最近邻聚类学习算法
被引量:
5
9
作者
李杰星
章云
符曦
机构
广东工业大学自动化研究所
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2000年第5期735-738,共4页
基金
广东省自然科学基金!(96 0 10 1)资助项目
文摘
提出了一种自适应模糊逻辑系统 (AFLS)的改进自适应学习算法 ,该算法将无导师学习算法与基于梯度信息的寻优学习算法相结和 。
关键词
模糊神经网络
非线性系统
最近
邻
聚
类
学习
算法
Keywords
clustering
fuzzy neural network
nonlinear system
adaptation
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
动态最近邻聚类算法的优化研究
被引量:
5
10
作者
储岳中
徐波
机构
南京航空航天大学航天学院
安徽工业大学计算机学院
出处
《计算机工程与设计》
CSCD
北大核心
2011年第5期1687-1690,共4页
基金
国家863高技术研究发展计划基金项目(2008AA12Z301)
安徽省教育厅自然科学基金项目(KJ2008B103)
文摘
针对最近邻聚类算法对聚类半径敏感、不易获得最优解的问题,提出了基于贝叶斯信息测度BIC(Bayesianinformationcriterion)的优化方法。通过DBSCAN算法对初始数据集进行预处理,去除噪声数据。在参数空间内逐步调整聚类半径,利用最近邻聚类算法对数据集进行聚类,并计算每次聚类结果的贝叶斯信息测度值。比较各次聚类结果的贝叶斯信息测度值,最大贝叶斯信息测度值对应的聚类即为最优聚类结果。实验结果表明,优化的最近邻聚类算法很好地解决了合适的聚类半径选取问题。
关键词
数据挖掘
密度
聚
类
算法
贝叶斯信息测度
最近
邻
聚
类
优化
Keywords
data mining
density-based spatical clustering of application with noise (DBSCAN)
Bayesian information criterion (BIC)
nearest neighbor clustering
optimization
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于AIC准则的最近邻聚类模型的优化算法
被引量:
13
11
作者
秦宣云
机构
中南大学数学与计算技术学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2005年第2期257-259,共3页
基金
国家十五重点攻关项目国家海洋技术发展项目基金资助课题(DY105-03-02)
文摘
聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出了理论分析。通过实例仿真,验证了本方法的实用性和正确性。
关键词
聚
类
分析
AIC准则
最近
邻
聚
类
算法
Keywords
cluster analysis
AIC criterion
the nearest neighbor clustering algorithm
分类号
O156 [理学—基础数学]
在线阅读
下载PDF
职称材料
题名
模糊逻辑系统的最近邻聚类学习算法
12
作者
李青茹
王培峰
尹志宇
机构
河北师范大学物理学院
河北科技大学信息科学与工程学院
出处
《组合机床与自动化加工技术》
北大核心
2004年第1期65-66,共2页
文摘
文章先提出了一种最优模糊逻辑系统 ,它能使样本中所有的输入—输出数据对都拟合到任意给定的精度 (在此意义上的最优 ) ;然后将这种最优模糊逻辑系统推广到大样本问题 ,为此 ,将样本数据用最近邻聚类算法进行分组 ,将每一组数据 (一个聚类 )视为一个数据对 ,用最优模糊逻辑系统来进行拟合。还给出了学习算法并进行了仿真实验 。
关键词
模糊逻辑系统
最近
邻
聚
类
输入-输出数据对
学习
算法
精度
Keywords
the optimization fuzzy logical system
the most neighbors clustering algorithm
input-ouput data
分类号
TP273.4 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
基于自然最近邻相似图的谱聚类
被引量:
8
13
作者
刘友超
张曦煌
机构
江南大学物联网工程学院
出处
《计算机应用研究》
CSCD
北大核心
2020年第1期30-33,39,共5页
基金
江苏省产学研合作项目(BY2015019-30).
文摘
传统谱聚类算法经常在处理一些结构复杂的数据集时效果不太理想,并且其相似度矩阵构造时参数的选取往往需要依靠多次实验及个人经验。在这种情况下,提出一种基于自然最近邻相似图的谱聚类(NSG-SC)算法。自然最近邻是一种新颖的最近邻概念,可以有效地避免K最近邻以及ε-最近邻方法需要人为设置参数的缺点。该算法构造相似度矩阵时依靠数据集自身的特性进行搜索,避免了参数选取不当以及离散点所带来的影响,更加真实地反映了数据集的结构关系。实验结果表明,提出的NSG-SC算法具有可行性和有效性。
关键词
谱
聚
类
自然
最近
邻
相似
图
相似度矩阵
Keywords
spectral clustering
natural nearest neighbor
similarity graph
affinity matrix
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
面向海量数据的改进最近邻优先吸收聚类算法
被引量:
5
14
作者
宁可
孙同晶
徐洁洁
机构
杭州电子科技大学自动化学院
浙江省电子信息产品检验所
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第4期35-40,共6页
基金
浙江省信息安全重点实验室基金(KYZ066816004)
文摘
针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,与K-means算法和最近邻优先吸收聚类算法相比,改进算法在保证聚类质量的基础上具有较快的运行速度,并适用于海量数据的聚类分析。
关键词
海量数据
聚
类
MAPREDUCE框架
最近
邻
优先吸收
聚
类
算法
Canopy
算法
并行化
Keywords
massive data
clustering
MapReduce framework
Nearest Neighbor Absorption First(NNAF)clustering algorithm
Canopy algorithm
parallelization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
公理化模糊共享近邻自适应谱聚类算法
被引量:
12
15
作者
储德润
周治平
机构
江南大学物联网技术应用教育部工程研究中心
出处
《智能系统学报》
CSCD
北大核心
2019年第5期897-904,共8页
文摘
针对传统的谱聚类算法通常利用高斯核函数作为相似性度量,且单纯以距离决定相似性不能充分表现原始数据中固有的模糊性、不确定性和复杂性,导致聚类性能降低的问题。提出了一种公理化模糊共享近邻自适应谱聚类算法,首先结合公理化模糊集理论提出了一种模糊相似性度量方法,利用识别特征来衡量更合适的数据成对相似性,然后采用共享近邻的方法发现密集区域样本点分布的结构和密度信息,并且根据每个点所处领域的稠密程度自动调节参数σ,从而生成更强大的亲和矩阵,进一步提高聚类准确率。实验表明,相较于距离谱聚类、自适应谱聚类、模糊聚类方法和地标点谱聚类,所提算法有着更好的聚类性能。
关键词
机器学习
数据挖掘
聚
类
分析
模糊
聚
类
谱
聚
类
公理化模糊集理论
共享
最近
邻
尺度参数
Keywords
machine learning
data mining
clustering analysis
fuzzy clustering
spectral clustering
axiomatic fuzzy settheory
shared nearest neighbor
scale parameter
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
共享近邻紧密度的增量式谱聚类算法
被引量:
3
16
作者
赵萌萌
王士同
机构
江南大学数字媒体学院
江南大学江苏省媒体设计与软件技术重点实验室
出处
《计算机科学与探索》
CSCD
北大核心
2020年第6期996-1004,共9页
基金
国家自然科学基金,No.61572236。
文摘
现有的基于共享近邻紧密度的谱聚类算法由于能很好地探索出数据点之间的潜在相似性关系,对未能完全分离的数据集具有健壮性,受到了越来越多的关注。但是,在运行时间和内存需求方面,它要花费的代价仍然十分昂贵,这使得其聚类处理能力不太高效,具有运行速度较慢,运行时间过长,面对大数据集时算法失效等缺点,因此该算法对于大规模数据集来说是不切实际的。为了克服这些缺点,提出了一种它的增量版本。该算法的思想是先将数据集分解为若干子集,然后以增量的方式在每个子集上运行,从而保证其具有良好的聚类性能。通过对人工数据集和仿真数据集进行大量的实验验证了该谱聚类算法的有效性。同时,该算法的时间消耗低,聚类精度高,且能够有效地对不断增加的数据集进行聚类。
关键词
谱
聚
类
共享
最近
邻
增量式
大规模数据
Keywords
spectral clustering
shared nearest neighbor
incremental
large-scale data
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于模糊最近邻的高维数据聚类
被引量:
5
17
作者
刘纪平
汪宏斌
汪诚波
周洞汝
机构
武汉大学计算机学院
宁波理工学院计算机科学系
出处
《小型微型计算机系统》
CSCD
北大核心
2005年第2期261-263,共3页
基金
国家自然科学基金项目 (60 173 0 45 )资助 .
文摘
提出一种基于模糊最近邻的聚类算法 (简称 FNNC算法 ) .FNNC算法通过加权共享最近邻图来形成簇 ,而且仅仅使用对象图中一些有用的连接 .本文通过实验验证了 FNNC算法在高维数据聚类中的有效性 .
关键词
模糊
最近
邻
聚
类
共享
最近
邻
聚
类
相似度量
密度测量
Keywords
FNNC
SNN
clustering
similarity measure
density measure
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
K近邻和加权相似性的密度峰值聚类算法
被引量:
21
18
作者
赵嘉
陈磊
吴润秀
张波
韩龙哲
机构
南昌工程学院信息工程学院
全球能源互联网研究院有限公司
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022年第12期2349-2357,共9页
基金
国家自然科学基金项目(52069014,61962036)
江西省杰出青年基金项目(2018ACB21029)资助。
文摘
密度峰值聚类算法的局部密度定义未考虑密度分布不均数据类簇间的样本密度差异影响,易导致误选类簇中心;其分配策略依据欧氏距离通过密度峰值进行链式分配,而流形数据通常有较多样本距离其密度峰值较远,导致大量本应属于同一个类簇的样本被错误分配给其他类簇,致使聚类精度不高.鉴于此,本文提出了一种K近邻和加权相似性的密度峰值聚类算法.该算法基于样本的K近邻信息重新定义了样本局部密度,此定义方式可以调节样本局部密度的大小,能够准确找到密度峰值;采用样本的共享最近邻及自然最近邻信息定义样本间的相似性,摒弃了欧氏距离对分配策略的影响,避免了样本分配策略产生的错误连带效应.流形及密度分布不均数据集上的对比实验表明,本文算法能准确找到疏密程度相差较大数据集的密度峰值,避免了流形数据的分配错误连带效应,得到了满意的聚类效果;同时在真实数据集上的聚类效果也十分优秀.
关键词
密度峰值
聚
类
局部密度
K近
邻
共享
最近
邻
自然
最近
邻
Keywords
density peaks clustering
local density
K-nearest neighbors
shared nearest neighbors
natural nearest neighbors
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于密度峰值和近邻优化的聚类算法
被引量:
7
19
作者
何云斌
董恒
万静
李松
机构
哈尔滨理工大学计算机科学与技术学院
出处
《计算机科学与探索》
CSCD
北大核心
2020年第4期554-565,共12页
基金
国家自然科学基金No.61872105
黑龙江省自然科学基金No.F201302
黑龙江省教育厅科学技术研究项目No.12531z004。
文摘
针对密度峰值算法在选取聚类中心时的时间复杂度过高,需要人工选择截断距离并且处理流形数据时有可能出现多个密度峰值,导致聚类准确率下降等问题,提出一种新的密度峰值聚类算法,从聚类中心选择、离群点筛选、数据点分配三方面进行讨论和分析,并给出相应的聚类算法。在聚类中心的选择上采取KNN的思想计算数据点的密度,离群点的筛选和剪枝以及数据点分配则利用Voronoi图的性质,结合数据点的分布特征进行处理,并在最后应用层次聚类的思想以合并相似类簇,提高聚类准确率。实验结果表明:所提算法与实验对比算法相比较,具有较好的聚类效果和准确性。
关键词
密度
聚
类
VORONOI
图
离群点
最近
邻
Keywords
density clustering
Voronoi diagram
outliers
nearest neighbors
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
密度不敏感的近邻传播聚类算法研究
被引量:
7
20
作者
冯晓磊
于洪涛
机构
国家数字交换系统工程技术研究中心
出处
《计算机工程》
CAS
CSCD
2012年第2期159-162,共4页
基金
国家"863"计划基金资助项目(2008AA011002
2011AA010603)
文摘
近邻传播算法在非凸形、密度不均匀的数据集上很难得到理想的聚类结果。为此,基于核聚类的思想,将数据集非线性地映射到高维空间,使数据集更加分离。利用共享最近邻的相似度度量方法,提出一种密度不敏感的近邻传播算法DIS-AP,以弥补原算法易受特征集维数和密度影响的缺点,从而有效解决数据集非凸和密度不均匀问题,拓宽算法的应用范围。仿真实验结果证明,DIS-AP算法具有更好的聚类性能。
关键词
近
邻
传播
相似度度量
核
聚
类
共享
最近
邻
聚
类
分析
密度不敏感
Keywords
Affinity Propagation(AP)
similarity measurement
kernel clustering
shared nearest neighbor
clustering analysis
density insensitive
分类号
TN915 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于反向最近邻的密度估计聚类算法
许梅梅
侯新民
《计算机工程与应用》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于共享最近邻的自适应密度峰值聚类算法
王心耕
杜韬
周劲
陈迪
仵匀政
《计算机科学》
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
3
融合转移概率矩阵的多阶最近邻图聚类算法
徐童童
解滨
张春昊
张喜梅
《计算机应用》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
4
改进的共享最近邻聚类算法
李霞
蒋盛益
《计算机工程与应用》
CSCD
北大核心
2011
3
在线阅读
下载PDF
职称材料
5
基于共享最近邻的密度自适应邻域谱聚类算法
葛君伟
杨广欣
《计算机工程》
CAS
CSCD
北大核心
2021
8
在线阅读
下载PDF
职称材料
6
结合自然和共享最近邻的密度峰值聚类算法
柏锷湘
罗可
罗潇
《计算机科学与探索》
CSCD
北大核心
2021
7
在线阅读
下载PDF
职称材料
7
罚处共享最近邻密度峰聚类算法
高润峰
苏一丹
覃华
《计算机工程与设计》
北大核心
2021
1
在线阅读
下载PDF
职称材料
8
基于注意力机制的不完备多视图聚类算法
杨成昊
胡节
王红军
彭博
《计算机应用》
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
9
一种改进的最近邻聚类学习算法
李杰星
章云
符曦
《控制理论与应用》
EI
CAS
CSCD
北大核心
2000
5
在线阅读
下载PDF
职称材料
10
动态最近邻聚类算法的优化研究
储岳中
徐波
《计算机工程与设计》
CSCD
北大核心
2011
5
在线阅读
下载PDF
职称材料
11
基于AIC准则的最近邻聚类模型的优化算法
秦宣云
《系统工程与电子技术》
EI
CSCD
北大核心
2005
13
在线阅读
下载PDF
职称材料
12
模糊逻辑系统的最近邻聚类学习算法
李青茹
王培峰
尹志宇
《组合机床与自动化加工技术》
北大核心
2004
0
在线阅读
下载PDF
职称材料
13
基于自然最近邻相似图的谱聚类
刘友超
张曦煌
《计算机应用研究》
CSCD
北大核心
2020
8
在线阅读
下载PDF
职称材料
14
面向海量数据的改进最近邻优先吸收聚类算法
宁可
孙同晶
徐洁洁
《计算机工程》
CAS
CSCD
北大核心
2018
5
在线阅读
下载PDF
职称材料
15
公理化模糊共享近邻自适应谱聚类算法
储德润
周治平
《智能系统学报》
CSCD
北大核心
2019
12
在线阅读
下载PDF
职称材料
16
共享近邻紧密度的增量式谱聚类算法
赵萌萌
王士同
《计算机科学与探索》
CSCD
北大核心
2020
3
在线阅读
下载PDF
职称材料
17
基于模糊最近邻的高维数据聚类
刘纪平
汪宏斌
汪诚波
周洞汝
《小型微型计算机系统》
CSCD
北大核心
2005
5
在线阅读
下载PDF
职称材料
18
K近邻和加权相似性的密度峰值聚类算法
赵嘉
陈磊
吴润秀
张波
韩龙哲
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022
21
在线阅读
下载PDF
职称材料
19
基于密度峰值和近邻优化的聚类算法
何云斌
董恒
万静
李松
《计算机科学与探索》
CSCD
北大核心
2020
7
在线阅读
下载PDF
职称材料
20
密度不敏感的近邻传播聚类算法研究
冯晓磊
于洪涛
《计算机工程》
CAS
CSCD
2012
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
5
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部