-
题名一种基于层次距离计算的聚类算法
被引量:11
- 1
-
-
作者
彭京
唐常杰
程温泉
石葆梅
乔少杰
-
机构
北京大学信息科学技术学院
四川大学计算机学院
成都市公安局科技处
-
出处
《计算机学报》
EI
CSCD
北大核心
2007年第5期786-795,共10页
-
基金
国家自然科学基金(60473071
60473051
+4 种基金
60503037)
中国博士后科学基金(20060400002)
四川省青年科技基金(07ZQ026-055)
国家"八六三"高技术研究发展计划项目基金(2006AA01Z230)
北京市自然科学基金(4062018)资助.
-
文摘
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算法标称型计算的缺陷,提高了聚类精度.针对聚类算法的中心点问题,提出了相应的层次编码型数据的快速处理算法,并从理论上证明了算法的正确性.实验表明,对比朴素处理算法,HDCA的性能明显提高.新算法已经应用到警用流动人口分析当中,取得了良好效果.
-
关键词
聚类
层次距离
层次编码变量
k-中心
数据挖掘
-
Keywords
clustering
hierarchy distance
hierarchy coding variants
k-medoids
data mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-