一种改进的遗传k-means聚类算法被引量：23

An Improved Genetic k-means Algorithm for Optimal Clustering

导出

摘要在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率. In the classical k-means algorithm,the value of k must be confirmed in advance.It is difficulty to confirm accurately the value of k in reality.This paper proposals an improved genetic k-means algorithm(IGKM) and constructs a fitness function defined as a product of three factors,maximization of which ensures the formation of a small number of compact clusters with large separation between at least two clusters.At last,two artificial and three real-life data sets are considered for experiments that compare IGKM with k-means algorithm,genetic cluster algorithm and genetic k-means algorithm by inter-cluster,inner-cluster and rate of right.The experiments show that IGKM can get the optimal value of k automatically and keep the high accuracy.

作者刘婷郭海湘诸克军高思维

机构地区中国地质大学管理学院

出处《数学的实践与认识》 CSCD 北大核心 2007年第8期104-111,共8页 Mathematics in Practice and Theory

基金国家自然科学基金(70273044 70573101) 教育部人文社科基金项目(06JA880668

关键词聚类 K-MEANS算法遗传算法 cluster k-means algorithm genetic algorithm

分类号 O212.1 [理学—概率论与数理统计]

引文网络
相关文献

参考文献9

1[2]Tou J T,Gonzalez R C.Pattern Recognition Principle[M].Addison Wesley,Reading,MA,1974.
2刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,25(6):54-58. 被引量：122
3[4]Murthy C A,Chowdhury N.In search of optimal clusters using genetic algorithms[J].PatternRecog Lett,1996,17:825-832.
4唐立新,杨自厚,王梦光.用遗传算法改进聚类分析中的K-平均算法[J].数理统计与应用概率,1997,12(4):350-356. 被引量：23
5傅景广,许刚,王裕国.基于遗传算法的聚类分析[J].计算机工程,2004,30(4):122-124. 被引量：49
6吕强,俞金寿.基于混合遗传算法的K-Means最优聚类算法[J].华东理工大学学报（自然科学版）,2005,31(2):219-222. 被引量：8
7[8]Sanghamitra Bandyopadhyay,Ujjwal Maulik.An evolutionary technique based on K-Means algorithm for optimal clustering in RN[J].Information Sciences,2002,146:221-237.
8杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
9[10]Malay K Pakhiraa,Sanghamitra Bandyopadhyayb,Ujjwal Maulikc.Validity index for crisp and fuzzy clusters[J].Pattern Recognition,2004,37:487-501.

二级参考文献16

1AnsariN HouE 李军边肇祺译.用于最优化的计算智能[M].北京：清华大学出版社,1999..
2Treshansky A,McGraw R.An overview of clustering algorithms[A].Proceedings of SPIE,The International Society for Optical Engineering[C].2001(4367):41-51.
3Clausi D A.K-means Iterative Fisher (KIF) unsupervised clustering algorithm applied to image texture segmentation[J].Pattern Recognition,2002,35:1959-1972.
4Bezdek J C,Pal N R.Some new indexes of cluster validity[J].IEEE Transactions on Systems,Man,and Cybernetics _ Part B:Cybernetics,1998,28(3):301-315.
5Ramze R M,Lelieveldt B P F,Reiber J H C.A new cluster validity indexes for the fuzzy c-mean[J].Pattern Recognition Letters,1998,19:237-246.
6Bandyopadhyay S, Maulik U. An evolutionary technique based on K-Means algorithm for optional clustering in R^N[J]. Information Sciences, 2002,146 : 221-237.
7Tou J T,Gonzalez R C. Pattern recognition principle[M]. Addison Wesley,Reading,1974.
8Krishma K, Murty M N. Genetic k-means algorithm[J].IEEE Trans on System,Man,and Cybernetics. Part B,1999,29(3):433-439.
9Maulik U,Bandyopadhay S. Genetic algorithm-based clustering technique[J]. Pattern Recognition,2000,33(9):1455-1465.
10李兵,蒋慰孙.混沌优化方法及其应用[J].控制理论与应用,1997,14(4):613-615. 被引量：535

共引文献374

1孙美卫.一种基于学习模型与BoW-SURF的目标识别算法[J].中原工学院学报,2021(1):79-83.
2刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：27
3段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：2
4刘文一,孙伟,朱良明,赵志博.舰载飞行器打击水面舰艇编队队形识别和目标选择方法[J].兵器装备工程学报,2020,41(2):85-89. 被引量：11
5鲜于建川,隽志才.基于遗传聚类算法的出行行为分析[J].计算机应用研究,2009,26(3):836-839.
6万尤宝,褚君浩,于天燕,余丙鲲.铁电晶体铌酸钾锂的二次谐波产生[J].人工晶体学报,2000,29(S1).
7楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
8徐辉,李石君.一种整合粒子群优化和K-均值的数据聚类算法[J].山西大学学报（自然科学版）,2011,34(4):518-523. 被引量：9
9曹树志,项响琴.基于改进的K_Means算法的城市高架桥交通流分析[J].公路交通科技（应用技术版）,2010,6(10):261-264.
10韩丽苹,孟海东,李海荣.聚类算法在矿产资源与经济发展关系研究中的应用[J].煤炭技术,2015,34(5):290-292.

同被引文献215

1陈寿文,李明东.遗传聚类算法及其改进[J].宿州学院学报,2008,23(4):101-102. 被引量：1
2况夯,罗军.基于遗传FCM算法的文本聚类[J].计算机应用,2009,29(2):558-560. 被引量：5
3陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
4孔锐,张国宣,施泽生,郭立.基于核的K-均值聚类[J].计算机工程,2004,30(11):12-13. 被引量：46
5王志群,朱守真,周双喜,黄仁乐,王连贵.分布式发电对配电网电压分布的影响[J].电力系统自动化,2004,28(16):56-60. 被引量：417
6张兴华.一种神经网络辨识的混合学习算法[J].计算机工程与应用,2004,40(28):33-36. 被引量：3
7史亮,邹谊,尹燕,庄镇泉.基于主动进化遗传算法的模糊聚类技术[J].小型微型计算机系统,2005,26(2):204-208. 被引量：5
8陈燕,耿国华,郑建国.一种改进的基于密度的聚类算法[J].微机发展,2005,15(3):17-19. 被引量：13
9万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
10吕俊,张兴华,张湜.基于自适应递阶遗传算法的神经网络优化策略[J].计算机工程与设计,2005,26(2):305-307. 被引量：12

引证文献23

1鲜于建川,隽志才.基于遗传聚类算法的出行行为分析[J].计算机应用研究,2009,26(3):836-839.
2童仲志,张媛,邢宗义,侯远龙,贾利民.某扫雷犁电液伺服系统的HGA-RBF神经网络建模[J].机床与液压,2009,37(7):113-116.
3胡彧,毕晋芝.遗传优化的K均值聚类算法[J].计算机系统应用,2010,19(6):52-55. 被引量：6
4洪亮亮,罗可.改进的基于遗传算法的粗糙聚类方法[J].计算机工程与应用,2010,46(25):142-145. 被引量：10
5陈寿文,李明东.遗传聚类算法改进及其仿真[J].计算机应用与软件,2010,27(9):100-102. 被引量：5
6田森平,吴文亮.自动获取k-means聚类参数k值的算法[J].计算机工程与设计,2011,32(1):274-276. 被引量：18
7汪勇,金菲,张瑞军.引导函数支配的进化模糊聚类算法[J].系统工程理论与实践,2011,31(2):302-307. 被引量：2
8罗德超,宫宝利,姬应江,刘鸿淼.基于改进k-均值算法的轻型车尾气排放数据聚类方法[J].汽车工程学报,2013,3(2):113-118.
9葛佶莛.基于聚类算法的学生成绩评价与管理机制研究[J].中国教育信息化（高教职教）,2014(7):75-78. 被引量：4
10王玉,李玉,赵泉华.利用RJMCMC算法的可变类SAR图像分割[J].信号处理,2014,30(10):1193-1203. 被引量：9

二级引证文献150

1胡攀,邓坤.基于改进条件生成对抗网络的分布式电源优化配置[J].智能计算机与应用,2022,12(5):81-88. 被引量：1
2洪亮亮,罗可.动态的粗糙增量聚类方法[J].计算机工程与应用,2011,47(24):106-110. 被引量：5
3王颖,刘建平.基于改进遗传算法的K-means聚类分析[J].工业控制计算机,2011,24(8):78-79. 被引量：4
4刘建华,王进,孟颖,王文生.基于模拟退火的粗糙集K均值电力负荷聚类分析[J].现代电力,2012,29(1):10-14. 被引量：5
5徐晓旻,肖仰华.KBAC:一种基于K-means的自适应聚类[J].小型微型计算机系统,2012,33(10):2268-2272. 被引量：6
6潘大庆.基于层次聚类的微博敏感话题检测算法研究[J].广西民族大学学报（自然科学版）,2012,18(4):56-59. 被引量：5
7尚冠宇,韩万兵,郭凡新,邓小鸿.改进的块差值无损鲁棒图像水印算法[J].计算机工程与设计,2013,34(3):809-813.
8罗德超,宫宝利,姬应江,刘鸿淼.基于改进k-均值算法的轻型车尾气排放数据聚类方法[J].汽车工程学报,2013,3(2):113-118.
9施侃晟,刘海涛,白英彩,宋文涛,洪亮亮.余弦度量和适应度函数改进的聚类方法[J].电子科技大学学报,2013,42(4):621-624. 被引量：4
10宋奔,于俊乐.面向和谐校园评价体系的AHP-GA算法研究[J].中国电子商情（通信市场）,2013(4):46-51.

1张大庆,徐再花.一种新的模糊聚类有效性指标[J].沈阳农业大学学报,2012,43(5):636-639. 被引量：2
2王宇.K-maxmins聚类算法[J].计算机工程与设计,2004,25(11):1884-1885. 被引量：4
3李飞,薛彬,黄亚楼.初始中心优化的K-Means聚类算法[J].计算机科学,2002,29(7):94-96. 被引量：47
4于剑,程乾生.模糊聚类方法中的最佳聚类数的搜索范围[J].中国科学（E辑）,2002,32(2):274-280. 被引量：130
5戴文华,焦翠珍,何婷婷.基于并行遗传算法的K-means聚类研究[J].计算机科学,2008,35(6):171-174. 被引量：17
6孙红艳,王英博.一种改进的小生境遗传聚类算法[J].计算机系统应用,2010,19(2):37-40. 被引量：3
7李桃迎,陈燕.一种改进FCM的快速优化算法及其应用[J].大连海事大学学报,2006,32(4):23-27. 被引量：4
8周开乐,杨善林.一种考虑数据类大小和密度差异的模糊聚类有效性指标[J].情报学报,2013,32(3):306-313. 被引量：2
9崔建斌,姬安召,张科.确定最佳聚类数的二阶差分统计法[J].安徽大学学报（自然科学版）,2017,41(2):61-67. 被引量：1
10胡玉锁,陈宗海.基于混合遗传算法的聚类分析[J].模式识别与人工智能,2001,14(3):352-355. 被引量：22

数学的实践与认识

2007年第8期

浏览历史

内容加载中请稍等...

一种改进的遗传k-means聚类算法被引量：23

参考文献9

二级参考文献16

共引文献374

同被引文献215

引证文献23

二级引证文献150

相关作者

相关机构

相关主题

浏览历史

一种改进的遗传k-means聚类算法 被引量：23

参考文献9

二级参考文献16

共引文献374

同被引文献215

引证文献23

二级引证文献150

相关作者

相关机构

相关主题

浏览历史

一种改进的遗传k-means聚类算法被引量：23