-
题名基于混合邻域图的复杂结构数据集层次聚类算法
- 1
-
-
作者
陈仲尚
冯骥
杨德刚
蔡发鹏
-
机构
重庆师范大学计算机与信息科学学院
-
出处
《智能系统学报》
北大核心
2025年第3期584-593,共10页
-
基金
重庆市教委科学技术研究项目(KJZD-M202300502,KJQN201800539)。
-
文摘
复杂结构数据集通常指包含不同形状(如球形、非球形、流形)、大小和密度的簇的数据集。自然邻居算法在处理边界模糊、密度变化的数据集时存在局限性,特别是在数据集中含有大量噪声时,其性能会显著下降。针对这些问题,本文提出一种基于混合邻域图的复杂结构数据集层次聚类算法(hybrid neighborhood graphbased hierarchical clustering algorithm for datasets with complex structures,HCHNG)。该方法提出一种共享自然邻域图方法,通过邻居关系稀疏数据集以减少噪声样本对聚类结果的影响。随后,HCHNG将数据集划分为子图并加以合并,这一策略增强了算法处理变密度数据集的能力,同时,定义一种新的子图相似性度量方法,提高同类子图间的相似性。此外,对自然邻域图进行改进,以提升其在识别边界模糊数据集时的性能。在具有复杂结构的人工数据集和真实数据集上的对比实验表明,本文算法不仅能有效识别变密度球形数据集,而且在含有大量噪声的复杂数据集中也拥有优越的性能,在处理具有复杂结构的数据集时比现有方法高效。
-
关键词
聚类分析
混合邻域图
共享自然邻居
改进的自然邻域图
共享自然邻域图
子图相似性
复杂数据集
数据挖掘
-
Keywords
cluster analysis
hybrid neighborhood graph
shared natural neighbors
improved natural neighborhood graph
shared natural neighborhood graph
subgraph similarity
complex dataset
data mining
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-