期刊文献+

K-means算法最佳聚类数确定方法 被引量:145

Method for determining optimal number of clusters in K-means clustering algorithm
在线阅读 下载PDF
导出
摘要 K-means聚类算法是以确定的类数k为前提对数据集进行聚类的,通常聚类数事先无法确定。从样本几何结构的角度设计了一种新的聚类有效性指标,在此基础上提出了一种新的确定K-means算法最佳聚类数的方法。理论研究和实验结果验证了以上算法方案的有效性和良好性能。 K-means clustering algorithm clusters datasets according to the certain clustering number k.However k cannot be confirmed beforehand.A new clustering validity index was designed from the standpoint of sample geometry.Based on the index a new method for determining the optimal clustering number in K-means clustering algorithm was proposed.Theoretical research and experimental results demonstrate the validity and good performance of the above-mentioned algorithm.
出处 《计算机应用》 CSCD 北大核心 2010年第8期1995-1998,共4页 journal of Computer Applications
基金 国家863计划项目(2007AA1Z158) 国家自然科学基金资助项目(60703106)
关键词 K-MEANS聚类 聚类数 聚类有效性指标 聚类分析 K-means clustering number of clusters clustering validity index cluster analysis
作者简介 (worldguard@sina.com) 周世兵(1972-),男,江苏盐城人,讲师,博士研究生,主要研究方向:人工智能、模式识别、生物信息学; 徐振源(1946-),男,上海人,教授,博士生导师,主要研究方向:混沌、同步控制、人工智能、生物信息学; 唐旭清(1963-),男,安徽望江人,副教授,博士,主要研究方向:计算智能、生物信息学。
  • 相关文献

参考文献8

  • 1CALINSKI R,HARABASZ J.A dendrite method for cluster analysis[J].Communications in Statistics,1974,3(1):1 -27.
  • 2DAVIES D L,BOULDIN D W.A cluster separation measure[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1979,1(2):224-227.
  • 3DUDOIT S,FRIDLYAND J.A prediction-based resampling method for estimating the number of clusters in a dataset[J].Genome Biology,2002,3(7):1-21.
  • 4DIMITRIADOU E,DOLNICAR S,WEINGESSEL A.An examination of indexes for determining the number of cluster in binary data sets[J].Psychometrika,2002,67(1):137-160.
  • 5KAPP A V,TIBSHIRANI R.Are clusters found in one dataset present in another dataset?[J].Biostatistics,2007,8(1):9-31.
  • 6孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量:1083
  • 7ROUSSEEUW P J.Silhouettes:a graphical aid to the interpretation and validation of cluster analysis[J].Journal of Computational and Applied Mathematics,1987,20(1):53 -65.
  • 8DEMB(E)L(E) D,KASTNER P.Fuzzy C-means method for clustering microarray data[J].Bioinformatics,2003,19(8):973-980.

二级参考文献1

共引文献1082

同被引文献1338

引证文献145

二级引证文献817

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部