-
题名基于多层次密度中心图的聚类算法
被引量:1
- 1
-
-
作者
卢建云
邵俊明
-
机构
电子科技大学计算机科学与工程学院(网络空间安全学院)
重庆电子科技职业大学人工智能与大数据学院
-
出处
《计算机工程与科学》
北大核心
2025年第2期327-335,共9页
-
基金
国家自然科学基金(62376054)
重庆市教委科学技术研究项目(KJQN202103109)。
-
文摘
密度聚类是一种依据数据对象之间的密度关系进行聚类的算法。密度聚类通过判断数据集中低密度对象与密度中心对象的隶属关系实现对数据集的划分,能够有效地处理数据集中各种大小、不同形状和密度的簇。然而,受到数据集变密度、噪声和复杂分布的影响,如何准确估计数据对象的局部密度并通过密度中心确定聚类数目仍是需要研究的问题。针对上述密度聚类问题提出一种多层次密度中心图的聚类算法CMDCG。首先,基于每个数据对象的邻域,利用信息熵计算其局部密度;其次,依据局部密度和邻域空间确定每个数据对象的隶属关系并确定密度中心;最后,通过变化邻域空间得到多层次密度中心,根据多层次密度中心的隶属关系构建图结构,得到图的连通分量即为初始聚类,其他数据对象根据隶属关系划归到对应的初始聚类。在人工和真实数据集上的实验结果表明,CMDCG算法能够准确地识别聚类数目并形成正确的初始聚类,算法对变密度和噪声情况下的数据集有很好的鲁棒性。
-
关键词
密度聚类
多层次密度中心
连通图
信息熵
邻域空间
-
Keywords
density clustering
multi-level density center
connected graph
information entropy
neighborhood space
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-