-
题名一种基于EPDS的快速K均值聚类算法
被引量:1
- 1
-
-
作者
陈作平
叶正麟
刘明
-
机构
西北工业大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2006年第12期191-192,195,共3页
-
基金
国家自然科学基金资助项目(10070006)
西北工业大学研究生创业种子基金资助项目(Z200570)
-
文摘
K-均值聚类是经常使用的一种数据聚类方法,但对大数据量情形,其聚类过程较慢,主要原因在于聚类过程中每个待聚类向量要反复进行一个最近邻搜索过程,以寻找与其距离最近的聚类中心;据此,文章提出使用扩展的部分失真搜索(Extended Partial Distortion Search,EPDS)来完成该最近邻搜索,极大地减少了完成聚类所需乘法次数。实验表明,相对于基本的K均值聚类算法,该方法可以节约1/3以上的计算量。
-
关键词
K均值聚类
扩展的部分失真搜索
最近邻搜索
-
Keywords
K-mean clustering
extended partial distortion search (epds)
Nearest neighbor search
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-