-
题名亲和力传播聚类算法中最佳聚类数量的确定
- 1
-
-
作者
何选森
何帆
薄喜柱
肖湘萍
-
机构
广州商学院鸿蒙研究院
湖南大学信息科学与工程学院
浙江外国语学院国际商学院
-
出处
《电子科技大学学报》
北大核心
2025年第5期740-754,共15页
-
基金
广东省普通高校特色创新项目(2024KTSCX131)。
-
文摘
亲和力传播(AP)聚类能自动搜索聚类数量和聚类中心,但它提供的聚类数量与数据固有的聚类结构相差较大。为此,提出一种确定数据集潜在聚类数量的方法。利用任意两个数据点的欧氏距离平方构成相似性矩阵,以数据样本容量和相似性矩阵中非对角元素的中位数为参数,建立偏好的更新公式以确定聚类数量;将相似性与可用性相加构成亲和矩阵,并将亲和矩阵中取正值的主对角元素作为聚类的质心,以实现聚类数量与质心数量的相互验证。通过对随机数据集以及真实数据集的仿真,对多种性能度量以及算法的运行时间进行评估,结果说明该方法不仅能准确地估计聚类的数量,而且能有效地加快算法的收敛,从而适应于大数据应用的要求。
-
关键词
亲和力传播
相似性
责任性
可用性
偏好值
-
Keywords
affinity propagation
similarity
responsibility
availability
preference
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
TP391
[自动化与计算机技术—计算机应用技术]
-