-
题名基于密度自适应距离的密度峰聚类
被引量:6
- 1
-
-
作者
李涛
葛洪伟
苏树智
-
机构
江南大学物联网工程学院
江南大学轻工过程先进控制教育部重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第6期1347-1352,共6页
-
基金
国家自然科学基金项目(61402203)资助
江苏省普通高校研究生科研创新计划项目(KYLX15_1169)资助
江苏高校优势学科建设工程项目资助
-
文摘
密度峰聚类是一种新的基于密度的聚类算法,该算法不需要预先指定聚类数目,能够发现非球形簇.针对基于欧氏距离的密度峰聚类算法无法有效处理复杂结构数据集的缺陷,提出了基于密度自适应距离的密度峰聚类算法:首先,基于欧氏距离和自适应相似度计算密度自适应距离,包括局部密度自适应距离和全局密度自适应距离,以更好地描述数据空间分布结构;其次,将密度自适应距离应用到密度峰聚类算法中,得到新算法.在人工数据集和UCI真实数据集上的实验表明,新算法不仅能够有效处理复杂结构数据集,而且具有更高的准确率.
-
关键词
聚类
密度峰聚类
自适应相似度
密度自适应距离
-
Keywords
clustering
density peaks clustering
adaptive similarity
density adaptive distance
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名自然邻居密度极值聚类算法
被引量:2
- 2
-
-
作者
张忠林
赵昱
闫光辉
-
机构
兰州交通大学电子与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第23期200-210,共11页
-
基金
国家自然科学基金(61662043,62062049)
甘肃省自然科学基金(21JR7RA288)。
-
文摘
针对密度峰值聚类算法存在数据集密度差异较大时,低密度区域聚类中心难以检测和参数敏感的问题,提出了一种新型密度极值算法。引入自然邻居概念寻找数据对象自然近邻,定义椭圆模型计算自然稳定状态下数据局部密度;计算数据对象余弦相似性值,用余弦相似性值来更新数据对象连通值,采用连通值划分高低密度区域和离群点;构造密度极值函数找到高低密度不同区域聚类中心点;将不同区域非聚类中心点归并到离其最近的聚类中心所在簇中。通过在合成数据集和UCI公共数据集实验分析:该算法比其他对比算法在处理密度分布差异较大数据集上取得了更好的结果。
-
关键词
聚类
自然邻居
密度自适应距离
锚点
连通值
密度极值
-
Keywords
clustering
natural neighbor
density adaptive distance
anchor points
connected value
density extreme
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-