-
题名自适应阈值约束的密度簇主干聚类算法
被引量:3
- 1
-
-
作者
张锦宏
陈梅
张弛
-
机构
兰州交通大学电子与信息工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第12期2880-2895,共16页
-
基金
国家自然科学基金(62266029)
甘肃省重点研发计划(21YF5GA053)
甘肃省高等学校产业支撑计划项目(2022CYZC-36)。
-
文摘
针对现有聚类算法识别任意簇时精度不足、对簇内数据点密度变化敏感、对异常点敏感以及阈值取值难以确定等问题,提出了自适应阈值约束的密度簇主干聚类算法(DCBAT)。该算法首先结合偏度系数和数据点密度均值定义了数据点密度可达自适应阈值,在该阈值的约束下将具有较高局部密度和较高相对距离的核心点按密度可达性分组,进而得到初始簇主干。接着将非核心数据点归并到其密度较大的最近邻所在簇中,得到初始簇。最后结合簇内密度差均值和比例系数定义了密度差自适应阈值,在该阈值的约束下于簇内点密度变化剧烈处拆分初始簇,得到最终簇。DCBAT在充分考虑数据分布特点和内部结构特点的情况下进行聚类,从而提高了聚类性能。与五个优秀算法k-means、DBSCAN、OPTICS、CFDP和MulSim在八个不同维度、不同类型的数据集上的实验结果表明,DCBAT算法具有识别任意簇效果佳、对簇内点密度变化不敏感、对异常点不敏感、聚类结果精确且稳定等特点,综合性能优于对比算法。
-
关键词
聚类
簇主干
密度可达自适应阈值
密度差自适应阈值
任意簇
-
Keywords
clustering
cluster backbone
reachability adaptive threshold of density
adaptive threshold of density Dvalue
arbitrary clusters
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-