摘要
K-means聚类算法是以确定的类数k为前提对数据集进行聚类的,通常聚类数事先无法确定。从样本几何结构的角度设计了一种新的聚类有效性指标,在此基础上提出了一种新的确定K-means算法最佳聚类数的方法。理论研究和实验结果验证了以上算法方案的有效性和良好性能。
K-means clustering algorithm clusters datasets according to the certain clustering number k.However k cannot be confirmed beforehand.A new clustering validity index was designed from the standpoint of sample geometry.Based on the index a new method for determining the optimal clustering number in K-means clustering algorithm was proposed.Theoretical research and experimental results demonstrate the validity and good performance of the above-mentioned algorithm.
出处
《计算机应用》
CSCD
北大核心
2010年第8期1995-1998,共4页
journal of Computer Applications
基金
国家863计划项目(2007AA1Z158)
国家自然科学基金资助项目(60703106)
作者简介
(worldguard@sina.com) 周世兵(1972-),男,江苏盐城人,讲师,博士研究生,主要研究方向:人工智能、模式识别、生物信息学;
徐振源(1946-),男,上海人,教授,博士生导师,主要研究方向:混沌、同步控制、人工智能、生物信息学;
唐旭清(1963-),男,安徽望江人,副教授,博士,主要研究方向:计算智能、生物信息学。