基于均值与最大距离乘积的初始聚类中心优化K-means算法被引量：17

Automatic Generation Cloud Optimization Based on Genetic Algorithm

在线阅读下载PDF

导出

摘要针对K-means算法随机选择初始聚类中心所出现的样本聚类结果随机性强、稳定性低、容易陷入局部最优和得不到全局最优解等问题,提出一种基于均值与最大距离乘积的初始聚类中心优化K-means算法。该算法首先选择距离样本集均值最远的数据对象加入聚类中心集合,再依次将与样本集均值和当前聚类中心乘积最大的数据对象加入聚类中心集合。标准数据集上的实验结果表明,与原始K-means的算法以及另一种改进算法相比,新提出的聚类算法具有更高的准确率。 Aiming at solving the problem of clustering results randomness,low stability,easy to fall into local optimum and no global optimal solution of K-means algorithm randomly chosen initial cluster centers,a kind of initial cluster center optimization K-means algorithm based on the product of the mean and maximum distance is put forward.Firstly,the farthest distance mean sample set of data objects are chosen to join the cluster center set,then the sample mean and maximum current cluster center product data object are set in turn to join the cluster center collection.Experimental results on the standard data sets show that,compared with the original K-means algorithm and another improved algorithm,the proposed new clustering algorithm has a higher accuracy rate.

作者段桂芹

机构地区广东松山职业技术学院计算机系

出处《计算机与数字工程》 2015年第3期379-382,共4页 Computer & Digital Engineering

基金 2013年广东省高职教育教学指导委员会教改项目(编号:XXJS-2013-2041) 广东松山职业技术学院技术应用重点课题(编号:2012-JYKY-19)资助

关键词 K-MEANS聚类算法均值最大距离乘积数据挖掘 K-means clustering algorithm mean maximum distance product data mining

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

作者简介段桂芹，女，硕士，讲师，研究方向：数据挖掘、多媒体技术。

引文网络
相关文献

参考文献12

1苏锦旗,薛惠锋,詹海亮.基于划分的K-均值初始聚类中心优化算法[J].微电子学与计算机,2009,26(1):8-11. 被引量：34
2HAN Jiawei, KAMBER M. Data Mining Concepts and Techniques[M]. IS. 1]: Morgan Kaufman Publishers, 2001.
3赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
4行小帅,潘进,焦李成.基于免疫规划的K-means聚类算法[J].计算机学报,2003,26(5):605-610. 被引量：81
5张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：62
6翟东海,鱼江,高飞,于磊,丁锋.最大距离法选取初始簇中心的K-means文本聚类算法的研究[J].计算机应用研究,2014,31(3):713-715. 被引量：109
7胡伟.一种改进的K_means聚类方法[J].计算机与现代化,2012(1):22-24. 被引量：6
8张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：44
9熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究,2011,28(11):4188-4190. 被引量：87
10周炜奔,石跃祥.基于密度的K-means聚类中心选取的优化算法[J].计算机应用研究,2012,29(5):1726-1728. 被引量：48

二级参考文献98

1褚娜,马利庄,王彦.聚类趋势问题的研究综述[J].计算机应用研究,2009,26(3):801-803. 被引量：6
2朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
3李凯,李昆仑,崔丽娟.模型聚类及在集成学习中的应用研究[J].计算机研究与发展,2007,44(z2):203-207. 被引量：7
4荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
5袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
6张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：61
7王汉芝,刘振全.一种新的确定K-均值算法初始聚类中心的方法[J].天津科技大学学报,2005,20(4):76-79. 被引量：9
8杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
9张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：59
10FAHIM A.M,SALEM A.M,TORKEY F.A,RAMADAN M.A.An efficient enhanced k-means clustering algorithm[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(10):1626-1633. 被引量：30

共引文献607

1许静涵,林礼娜,武义天,张德威,Pascal Grange,袁玲龙.基于引力模型和聚类分析的城市群经济结构研究——以长三角23市为例[J].浙江金融,2021(2):64-74. 被引量：1
2赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：6
3段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
4楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
5张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
6秦亮,张文广,周绍磊,史贤俊.基于Parzen窗估计的核k-means聚类方法[J].计算机工程,2011,37(S1):217-219. 被引量：1
7高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
8周爱武,汪贤惠,刘慧婷.基于HowNet词汇相关性的文本聚类[J].微电子学与计算机,2015,32(4):90-93. 被引量：4
9陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
10钟将,吴中福,吴开贵,欧灵.基于人工免疫网络的动态聚类算法[J].电子学报,2004,32(8):1268-1272. 被引量：24

同被引文献120

1李桂林,陈晓云.关于聚类分析中相似度的讨论[J].计算机工程与应用,2004,40(31):64-65. 被引量：26
2邱承武,宓群超.利用电力数据四级网实现小电厂数据的采集[J].电力系统自动化,2006,30(3):105-106. 被引量：4
3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
4姜大源.学科体系的解构与行动体系的重构——职业教育课程内容序化的教育学解读[J].中国职业技术教育,2006,22(7):14-17. 被引量：293
5王海峰,夏洪雷,孙冰.基于程序行为特征的病毒检测技术与应用[J].计算机系统应用,2006,15(5):29-31. 被引量：6
6贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：230
7胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20. 被引量：36
8蒋盛益,姜灵敏.一种高效异常检测方法[J].计算机工程,2007,33(7):166-168. 被引量：7
9袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：155
10王珊珊,孔韦韦,张捷.基于计算机变形病毒及其防治现状的探讨[J].计算机与数字工程,2007,35(8):78-81. 被引量：7

引证文献17

1段桂芹,邹臣嵩.基于K-medoids算法的学生成绩聚类研究[J].微型电脑应用,2020,0(2):64-66. 被引量：1
2段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
3朱俚治.一种基于计算机病毒行为权值的检测算法[J].信息技术与标准化,2018(12):69-72.
4贺德富,苏喜生.基于聚类分析算法的伙食费类区划分研究[J].计算机与数字工程,2016,44(9):1645-1649.
5张明微,吴海涛.一种优化初始聚类中心的k-means算法[J].上海师范大学学报（自然科学版）,2016,45(5):599-603. 被引量：2
6杨宇,邹臣嵩,谭永洲.一种基于序列聚类的现代学徒制课程体系建构方法[J].韶关学院学报,2017,38(6):21-26. 被引量：2
7唐东凯,王红梅,胡明,刘钢.优化初始聚类中心的改进K-means算法[J].小型微型计算机系统,2018,39(8):1819-1823. 被引量：35
8王泾燃,张志宏,张钟浩,彭章友.一种新的克服粒子滤波样本贫化的粗化策略[J].电子测量技术,2018,41(14):45-49.
9邹臣嵩,刘松.基于谱聚类的全局中心快速更新聚类算法[J].计算机与现代化,2018(10):6-11. 被引量：3
10隋心怡,王瑞刚,张鸿翔.一种改进的K-均值聚类算法[J].计算机与数字工程,2018,46(4):682-685. 被引量：15

二级引证文献97

1卢功靖,卢林艳,李媛媛,王成军.基于议题类型的临近预测:使用社交媒体预测新冠肺炎疫情确诊人数[J].中国网络传播研究,2021(4):93-117. 被引量：1
2胡聪,徐敏,洪德华,刘翠玲,薛晓茹,王海鑫.基于改进K-medoids聚类和SVM的异常用电模式在线检测方法[J].国外电子测量技术,2022,41(2):53-59. 被引量：12
3邹臣嵩,杨宇.基于最大距离积与最小距离和协同K聚类算法[J].计算机应用与软件,2018,35(5):297-301. 被引量：15
4徐建国,韩青君,李青.K-means聚类算法及其在网络舆情中的应用[J].软件导刊,2018,17(11):65-67. 被引量：1
5段桂芹.基于全局中心聚类算法的学生成绩评价研究[J].智能计算机与应用,2019,9(1):80-83.
6蔡晓云,尹贺峰,傅文进,赵航涛.一种改进的最小二乘回归子空间分割方法[J].计算机与现代化,2019(5):118-121.
7潘品臣,姜合,吕奕锟.一种非独立同分布下K-means算法的初始中心优化方法[J].小型微型计算机系统,2019,40(6):1254-1259. 被引量：7
8任智君,郭红霞.市场环境下多主体参与的主动配电网双层优化配置[J].水电能源科学,2019,37(8):187-190.
9谢鹏寿,张宽,范宏进,贵向泉,张恩展.汽车4S店TFM客户细分模型及其方法研究[J].小型微型计算机系统,2019,40(10):2165-2169. 被引量：7
10向志华,邵亚丽.一种结合贪心选择和特征加权的高维数据聚类算法[J].电子科技,2019,32(11):70-73. 被引量：6

1张春生,吉日木图.基于字符及位的P乘积盒软件双加密[J].微计算机应用,2000,21(1):26-26.
2谢霖铨,张思洁.基于一种改进K-means算法的入侵检测系统研究[J].河南科技,2015,34(8):23-25.
3赵雪琴,宋利敏.一种新的聚类算法在入侵检测中的应用研究[J].信息安全与通信保密,2006,28(4):84-86. 被引量：5
4程华.一种基于构造法的椭圆曲线改进算法[J].网络安全技术与应用,2009(12):62-64. 被引量：1
5陈培芝,陈水利,陈国龙.Gabor小波和局部二值模式结合的一种人脸识别算法[J].集美大学学报（自然科学版）,2010,15(4):317-320. 被引量：1
6臧传真,范玉顺.面向监控和管理的无线传感器网络拓扑发现算法[J].计算机应用研究,2006,23(11):230-233. 被引量：2
7娄全福,胡忠刚.格值有限状态机的乘积与覆盖[J].模糊系统与数学,2016,30(6):184-190.
8白云晖.基于信息增益特征选取和覆盖的中文文本分类[J].福建电脑,2008,24(7):113-114.
9虞超.基于A1优化的无线传感网拓扑构建方法的研究[J].电子技术与软件工程,2014(17):40-40.
10Excel中统计函数介绍和计算（二）[J].安徽省情省力,2006(4):46-47.

计算机与数字工程

2015年第3期

浏览历史

内容加载中请稍等...

基于均值与最大距离乘积的初始聚类中心优化K-means算法被引量：17

参考文献12

二级参考文献98

共引文献607

同被引文献120

引证文献17

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于均值与最大距离乘积的初始聚类中心优化K-means算法 被引量：17

参考文献12

二级参考文献98

共引文献607

同被引文献120

引证文献17

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于均值与最大距离乘积的初始聚类中心优化K-means算法被引量：17