基于竞争思想的分级聚类算法被引量：3

Hierarchical Clustering Algorithm Based on Competitive Learning

导出

摘要为了解决海量数据分析中的非凸状等复杂聚类问题,同时兼顾聚类算法运算速度,提出了一种新的基于竞争思想的快速分级聚类算法.首先,根据给定邻域半径对数据进行第1级分类;然后,在第1级聚类的基础上,基于数据竞争的思想,以簇间数据密度为依据,设立第1级聚类生成的小簇之间小簇联系性权重的增加准则;最后,依据该准则计算有联系的小簇之间联系权重,对达到权重阈值的小簇进行合并,从而解决非凸状等复杂聚类问题.仿真实验表明,算法的聚类精度和抗噪声能力均优于传统的K-means算法和基于密度的DBSCAN(densitybased spatial clustering of applications with noise)算法.由于算法复杂度较低,算法对于大数据的聚类分析将会具有更好的适用性. We propose a new hierarchical clustering algorithm based on competition theory to solve the issue of nonconvex and other complex clustering for massive data analysis with efficient computation.First,we separate the data into a number of sub-clusters according to a given rudimentary clustering radius.Then,on the basis of the first-level clustering,we establish a criterion for strengthening the inter-cluster association weight based on the idea of data competition depending on the data density between the sub-clusters.Finally,the sub-clusters with qualified association weights are grouped into resultant clusters to solve complex clustering problems,such as non-convex clustering.The clustering accuracy and anti-noise capability of the new hierarchical clustering algorithm are superior to those of the traditional K-means algorithm and density-based DBSCAN clustering algorithms.Given the low complexity of the algorithm,the proposed algorithm can be used in clustering analysis of big data.

作者张文倩庄华亮陈翔何熊熊

机构地区浙江工业大学信息工程学院浙江三门县人民医院

出处《信息与控制》 CSCD 北大核心 2017年第5期614-619,626,共7页 Information and Control

基金浙江省公益技术研究社会发展项目(2013C33069) 浙江省科技项目(2013C33083) 三门县科技计划项目(12401)

关键词分级聚类复杂聚类竞争算法联系性权重类合并 hierarchical clustering complex clustering competition algorithm link weight class merging

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(3):321-328. 被引量：198
2杨黎刚,苏宏业,张英,褚健.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,29(8):133-136. 被引量：32
3李大字,钱丽,靳其兵,谭天伟.改进的全局K′-means算法及其在数据分类中的应用[J].信息与控制,2011,40(1):100-104. 被引量：6
4苏卫星,朱云龙,刘芳,马连博.基于改进模糊聚类的同构多传感器在线数据融合方法[J].信息与控制,2015,44(5):557-563. 被引量：9
5王赛芳,戴芳,梁波,张晓宇.一种基于路径的划分聚类算法[J].信息与控制,2011,40(1):141-144. 被引量：6
6李军,黄杰.基于自组织映射神经网络的局部自回归方法在网络流量预测中的应用[J].信息与控制,2016,45(1):120-128. 被引量：13
7周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
8段敏,张锡恩.基于合并思想和竞争学习思想的聚类新算法[J].计算机工程与设计,2006,27(9):1656-1659. 被引量：3
9周开乐,杨善林,丁帅,罗贺.聚类有效性研究综述[J].系统工程理论与实践,2014,34(9):2417-2431. 被引量：115
10张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：61

二级参考文献280

1王守强,朱大铭,韩爱丽.基于初始点选取的k-means聚类近似常数算法[J].计算机研究与发展,2007,44(z2):69-74. 被引量：3
2段战胜,韩崇昭,陶唐飞.基于最近统计距离的多传感器一致性数据融合[J].仪器仪表学报,2005,26(5):478-481. 被引量：17
3杨小军,潘泉,梁彦,温苗利.基于粒子滤波和检测信息的多传感器融合跟踪[J].信息与控制,2005,34(3):356-359. 被引量：4
4李瑞,邱玉辉.基于离散点的蚁群聚类算法的研究[J].计算机科学,2005,32(6):111-113. 被引量：5
5邓赵红,王士同.鲁棒性的模糊聚类神经网络[J].软件学报,2005,16(8):1415-1422. 被引量：11
6杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：194
7李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：116
8李战明,陈若珠,张保梅.同类多传感器自适应加权估计的数据级融合算法研究[J].兰州理工大学学报,2006,32(4):78-82. 被引量：34
9王丽娟,关守义,王晓龙,王熙照.基于属性权重的Fuzzy C Mean算法[J].计算机学报,2006,29(10):1797-1803. 被引量：46
10田铮,李小斌,句彦伟.谱聚类的扰动分析[J].中国科学（E辑）,2007,37(4):527-543. 被引量：33

共引文献543

1蒙克,华冉,汪佩洁.重新发现比较社会政策研究:概念化与方法[J].中国公共政策评论,2020(2):1-27. 被引量：2
2吕超,鲁洪良,于洋,王昊阳,吴绍斌.基于分层强化学习和社会偏好的自主超车决策系统[J].中国公路学报,2022,35(3):115-126. 被引量：9
3陈卫东,胡盛林.兼顾公平和效率原则的我国电力市场碳配额分配方案[J].煤炭经济研究,2020,40(1):15-21. 被引量：8
4郭林,程保增,张博.定量方法在古墓葬研究中的运用——以邹县野店墓地为例[J].洛阳考古,2022(2):24-29.
5黄贤英,阳安志,刘小洋,刘广峰.融合兴趣的微博用户相似度计算研究[J].计算机应用研究,2020,37(1):66-70. 被引量：1
6刘嘉嘉,杜习英.一种新的基于密度的自适应取样聚类算法[J].电脑知识与技术（过刊）,2007(2):478-480.
7张海龙,王仁彪,聂俊,刘进忠.海量数据的网格启发信息密度聚类算法[J].吉林大学学报（工学版）,2011,41(S2):254-258. 被引量：2
8路小娟,朱正平.太阳能光伏发电量分类预测研究[J].自动化与仪器仪表,2016(1):27-28. 被引量：1
9宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
10陈燕俐,洪龙,金达文,朱梧槚.一种简单有效的基于密度的聚类分析算法[J].南京邮电学院学报（自然科学版）,2005,25(4):24-29. 被引量：8

同被引文献23

1杨黎刚,苏宏业,张英,褚健.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,29(8):133-136. 被引量：32
2杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
3王赛芳,戴芳,梁波,张晓宇.一种基于路径的划分聚类算法[J].信息与控制,2011,40(1):141-144. 被引量：6
4李桃迎,陈燕,张金松,张琳.一种面向分类属性数据的聚类融合算法研究[J].计算机应用研究,2011,28(5):1671-1673. 被引量：7
5王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(3):321-328. 被引量：198
6姚登举,杨静,詹晓娟.基于随机森林的特征选择算法[J].吉林大学学报（工学版）,2014,44(1):137-141. 被引量：269
7周开乐,杨善林,丁帅,罗贺.聚类有效性研究综述[J].系统工程理论与实践,2014,34(9):2417-2431. 被引量：115
8王宏威,李国和.基于属性相似度的连续型特征选择方法[J].渤海大学学报（自然科学版）,2014,35(4):350-355. 被引量：3
9陈晋音,何辉豪.基于密度和混合距离度量方法的混合属性数据聚类研究[J].控制理论与应用,2015,32(8):993-1002. 被引量：11
10苏卫星,朱云龙,刘芳,马连博.基于改进模糊聚类的同构多传感器在线数据融合方法[J].信息与控制,2015,44(5):557-563. 被引量：9

引证文献3

1姜智涵,朱军,周晓锋,李帅.基于信息熵的混合属性数据谱聚类算法[J].计算机应用研究,2019,36(8):2256-2260. 被引量：13
2袁志琴,庄华亮,何熊熊.面向变尺度密度数据的分级聚类算法[J].计算机应用,2020,40(S02):54-59. 被引量：4
3李国和,杨绍伟,吴卫江,郑艺峰.决策信息系统的连续型特征选取方法[J].信息与控制,2019,48(2):224-231. 被引量：1

二级引证文献18

1王红,陈功平.信息熵加权的协同聚类算法的改进与优化[J].宁夏师范学院学报,2020,41(1):59-65. 被引量：1
2刘雁行,王婷.基于PSD-BPA的电力系统监测大数据属性约简方法[J].自动化与仪器仪表,2020(9):216-219. 被引量：4
3谭令,孙梓宽,王庆国.基于中医传承辅助平台的现代中医药治疗慢性乙型肝炎用药规律分析[J].中西医结合肝病杂志,2020,30(6):484-488. 被引量：4
4柯行思,吴梦昭,李博,王云飞,周苏.基于改进熵权法的电力信用数据敏感度监控算法[J].电子设计工程,2020,28(24):66-69. 被引量：4
5周南.基于属性分类的工程数据线索特征挖掘方法研究[J].信息工程大学学报,2020,21(6):694-698.
6张厚禄,唐云祁,王子扬.基于停留点密度聚类的轨迹区域划分方法[J].中国人民公安大学学报（自然科学版）,2021,27(3):102-108.
7王舒梵,严涛,姜新盈.谱聚类欠取样下自编码网络不平衡数据挖掘[J].计算机系统应用,2021,30(10):331-335. 被引量：1
8曾维佳,秦放,李琳,徐鹏.基于信息熵的粗糙集属性应急数据去重挖掘算法研究[J].计算技术与自动化,2021,40(4):64-68. 被引量：4
9亓北林.基于信息熵预警模型的智能情报真伪识别系统设计[J].自动化与仪器仪表,2021(12):116-119. 被引量：1
10李洁,许青,张露露,王英明.基于网格耦合的混合属性大数据聚类算法研究[J].信息工程大学学报,2022,23(2):218-223. 被引量：2

1何宣.如何使小学语文教学中学生的课堂阅读和写作的同步提高[J].考试周刊,2017,0(42):50-50. 被引量：1
2原亚宁,李琳,杨作梁,魏春枝.基于改进帝国竞争算法的交直流混合微网经济调度[J].智慧电力,2017,45(8):96-102. 被引量：2
3刘凯迪.中国梦与中国特色社会主义共同理想[J].长江丛刊,2017,0(24):101-101.
4杜云开,顾乃杰,邵祎康,丁世举.一种基于Petri网验证的数据竞争检测方法[J].小型微型计算机系统,2017,38(10):2352-2357. 被引量：1
5张贞彩.高中生物生活化教学初探[J].中学生物教学,2017,0(7X):36-36. 被引量：2
6天骄爱生活在思考与探索中不断突破[J].中国物业管理,2017,0(8).
7赛迪智库.大数据竞争从垄断向开放演变[J].软件和集成电路,2017,0(9):33-37.
8叶琪飞.回归概念是良策洛氏法则为哪般[J].数学通报,2017,56(10):46-48. 被引量：8
9肖楠.“印势”论绎[J].中国书法,2017(20):144-148.
10刘纪伟,赵杨,李绍晖.一种基于改进K-means算法的网络流量分类方法[J].电子技术应用,2017,43(11):86-89. 被引量：13

信息与控制

2017年第5期

浏览历史

内容加载中请稍等...

基于竞争思想的分级聚类算法被引量：3

参考文献11

二级参考文献280

共引文献543

同被引文献23

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于竞争思想的分级聚类算法 被引量：3

参考文献11

二级参考文献280

共引文献543

同被引文献23

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于竞争思想的分级聚类算法被引量：3