基于不均匀密度的自动聚类算法被引量：3

Auto-clustering Algorithm Based on Non-uniform Density

在线阅读下载PDF

导出

摘要针对基于密度的聚类算法不能自动处理密度分布不均匀的数据问题,提出一种基于不均匀密度的自动聚类算法。该算法既保持了一般基于密度算法的优点,也能有效地处理分布不均匀的数据。实验结果表明,该算法是有效的。 According to the fact that few density-based clustering algorithm can automatically process the data with non-uniform density, an auto-clustering algorithm based on non-uniform density is proposed. This algorithm has all the merits of the existed density-based clustering algorithm and can deal with the date effectively. Experimental results show its efficiency.

作者崔尚卿马秀莉唐世渭王文清

机构地区北京大学视觉与听觉信息处理国家重点实验室北京大学数字图书馆研究所

出处《计算机工程》 CAS CSCD 北大核心 2008年第23期86-88,共3页 Computer Engineering

基金国家"十五"计划基金资助项目"中国高等教育文献保障系统(CALIS)二期工程"(发改社会[2004]1659号)

关键词聚类密度不均匀数据挖掘 clustering density non-uniform data mining

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

作者简介崔尚卿（1983-），男，硕士研究生，主研方向：数据挖掘，数字图书馆；E-mail：cuisq@cis．pku．edu．cn 马秀莉，讲师、博士；唐世渭，教授、博士生导师；王文清，高级工程师、博士

引文网络
相关文献

参考文献5

1Ester M. A Density-based Algorithm for Discovering Clusters in Large Databases with Noise[C]//Proc. of the 2nd ACM SIGKDD Int'l Conf. on Knowledge Discovery and Data Mining. Portland, OR, USA: [s. n.], 1996.
2Liu Dongquan, Sourina O, Free-parameters Clustering of Spatial Data with Non-uniform Density[C]//Proc. of the 2004 IEEE Conf. on Cybernetics and Intelligent Systems. Singapore: [s. n.], 2004.
3Kamber M. Data Mining: Concepts and Techniques[M]. [S. l.]: Morgan Kaufmann Press, 2006.
4Alexander An Efficient Approach to Clustering in Large Multimedia Databases with Noise[C]//Proc. of American Association for Artificial Intelligence. Madison, Wisconsin, USA: [s. n.], 1998.
5马帅,王腾蛟,唐世渭,杨冬青,高军.一种基于参考点和密度的快速聚类算法[J].软件学报,2003,14(6):1089-1095. 被引量：108

二级参考文献8

1Han JW, Kambr M. Data Mining Concepts and Techniques. Beijing: Higher Education Press, 2001. 145-176.
2Kaufan L, Rousseeuw PJ. Finding Groups in Data: an Introduction to Cluster Analysis. New York: John Wiley & Sons, 1990.
3Ester M, Kriegel HP, Sander J, Xu X. A density based algorithm for discovering clusters in large spatial databases with noise. In:Simoudis E, Han JW, Fayyad UM, eds. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining.Portland: AAAI Press, 1996. 226-231.
4Guha S, Rastogi R, Shim K. CURE: an efficient clustering algorithm for large databases. In: Haas LM, Tiwary A, eds. Proceedings of the ACM SIGMOD International Conference on Management of Data. Seattle: ACM Press, 1998. "73-84.
5Agrawal R, Gehrke J, Gunopolos D, Raghavan P. Automatic subspace clustering of high dimensional data for data mining application. In: Haas LM, Tiwary A, eds. Proceedings of the ACM SIGMOD International Conference on Management of Data.Seattle: ACM Press, 1998.94-105.
6Alexandros N, Yannis T,Yannis M. C^2P: clustering based on closest pairs. In: Apers PMG, Atzeni P, Ceri S, Paraboschi S,Ramamohanarao K, Snodgrass RT, eds. Proceedings of the 27th International Conference on Very Large Data Bases. Roma:Morgan Kaufmann Publishers, 2001. 331-340.
7Berchtold S, Bohm C, Kriegel H-P. The pyramid-technique: towards breaking the curse of dimensionality. In: Haas LM, Tiwary A,eds. Proceedings of the ACM SIGMOD International Conference on Management of Data. Seattle: ACM Press, 1998. 142- 153.
8Yu C, Ooi BC, Tan K-L, Jagadish HV. Indexing the distance: an efficient method to KNN processing. In: Apers PMG, Atzeni P,Ceri S, Paraboschi S, Ramamohanarao K, Snodgrass RT, eds. Proceedings of the 27th International Conference on Very Large Data Bases. Roma: Morgan Kaufmann Publishers, 2001. 421--430.

共引文献107

1李玉鑑.自适应K-均值聚类算法[J].计算机研究与发展,2007,44(z2):100-104. 被引量：5
2薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
3陈燕,耿国华,郑建国.一种改进的基于密度的聚类算法[J].微机发展,2005,15(3):17-19. 被引量：13
4王恬宇.基于空间聚类的图像检索方法[J].情报杂志,2005,24(4):108-109.
5董子祥,赵阔.解决大学生心理问题的重要手段——网络化教育[J].社会科学论坛（学术研究卷）,2005(4):100-101.
6石陆魁,何丕廉.一种基于密度的高效聚类算法[J].计算机应用,2005,25(8):1824-1826. 被引量：21
7文登敏,张丽梅.基于对象“形状”的聚类算法[J].计算机应用与软件,2005,22(12):121-123.
8陈卓,孟庆春,魏振钢,任丽婕,窦金凤.一种基于网格和密度凝聚点的快速聚类算法[J].哈尔滨工业大学学报,2005,37(12):1654-1657. 被引量：14
9李锁花,孙志挥,周晓云.基于特征向量的分布式聚类算法[J].计算机应用,2006,26(2):379-382. 被引量：6
10王伦文.聚类的粒度分析[J].计算机工程与应用,2006,42(5):29-31. 被引量：19

同被引文献28

1陈小荷.从自动句法分析角度看汉语词类问题[J].语言教学与研究,1999(3):63-72. 被引量：23
2Boley D, Gini M, Gross R, et al. Partitioning - based Clustering for Web Document Categorization [ J ]. Decision Support Systems, 1999, 27(3) :329 -341.
3Mao J, Jain A K. A Self- organizing Network for Hypellipsoidal Clustering [J]. 1EEE Transactions on Neural Networks, 1996, 7 (1) :16 -29.
4I Cai W, Chen S, Zhang D. Fast and Robust Fuzzy C - means Clus- tering Algorithms Incorporating Local Information for Image Seg- mentation[ J ]. Pattern Recognition, 2007, 40(3 ) :825 - 838.
5Chen H H, Lin C J. A Multilingual News Summarizer[ C]. In: Proceedings of the 18th International Conference on Computational Linguistics. Stroudsburg: Association for Computational Linguis- tics, 2000 : 159 - 165.
6Leftin L J. Newsblaster Russian - English Clustering Performance Analysis [ R ]. Columbia Computer Science Technical Reports, 2003.
7Evans D K, Klavans J L, McKeown K R. Columbia Newsblaster: Muhilingual News Summarization on the Web Demonstration [ C ]. In : Proceedings of HLT - NAACL 2004. Stroudsburg: Association for Computational Linguistics, 2004 : 1 -4.
8Mathieu B, Besancon R, Fluhr C. Muhilingual Document Clusters Discovery [ C] . In : Proceedings of RIAO 2004. 2004 : 116 - 125.
9Dhillon 1 S, Mallela S, Kumar R. A Divisive Information Theoretic Feature Clustering Algorithm for Text Classification [ J ]. The Jour- nal of Machine Learning Research,2003,3 ( 1 ) : 1265 - 1287.
10Marcus M P, Marcinkiewicz M A, Santorini B. Building a Large An- notated Corpus of English : The Penn Treebank [ J ]. Computational Linguistics, 1993,19 ( 2 ) :313 - 330.

引证文献3

1茌良生,徐建.一种基于密度变化的无监督聚类算法[J].智能计算机与应用,2020(7):300-302.
2王东波,朱丹浩.面向汉语句法功能分布知识库的词汇类别知识挖掘研究[J].现代图书情报技术,2013(3):33-37. 被引量：5
3王东波,朱丹浩.基于CABOSFV聚类算法的汉语词汇类别知识挖掘研究[J].计算机科学,2013,40(7):211-215. 被引量：1

二级引证文献6

1许鑫,郭金龙.基于领域本体的专题库构建——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):2-9. 被引量：18
2郭金龙,洪韵佳,许鑫.中华烹饪文化领域本体构建及其应用[J].现代图书情报技术,2013(12):10-18. 被引量：7
3洪韵佳,许鑫.基于领域本体的知识库多层次文本聚类研究——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):19-26. 被引量：9
4吴珊燕,许鑫.基于案例推理的菜谱推荐系统研究[J].现代图书情报技术,2013(12):34-41. 被引量：5
5张志强,王伟钧,杨晋浩,周晓清,郑加林.一种行业领域词库标识树的正确性检测算法研究[J].现代电子技术,2018,41(18):88-91. 被引量：1
6王晨,尹静,王红春.基于分拣机器人零售电商订单动态聚类及仿真[J].包装工程,2020,41(3):170-175. 被引量：5

1李俊,周宇葵.数据挖掘在生物医学工程文献检索中的应用[J].图书馆学研究,2008(1):22-24.
2史慧峰,马晓宁.一种自适应的模糊C均值聚类算法[J].无线通信技术,2016,25(3):40-45. 被引量：6
3杜欣,刘大刚,张开活,申远,赵康,倪友聪.基于统一计算设备架构和基因表达式编程的自动聚类算法[J].计算机应用,2013,33(7):1890-1893. 被引量：1
4马云红,王成汗,江腾蛟,张堃.一种基于数据包含度的自动聚类算法[J].西北工业大学学报,2016,34(5):863-866. 被引量：1
5姜代红,张三友.基于基因表达式编程的K均值自动聚类算法[J].计算机仿真,2010,27(12):216-220. 被引量：10
6邹鹏,李凡长,尹宏伟,张莉,张召.基于边界检测的多流形学习算法[J].模式识别与人工智能,2016,29(11):1037-1047. 被引量：1
7赵洪彪,周立柱.Client/Server结构系统中的处理分布[J].计算机科学,1997,24(5):85-86. 被引量：7
8陈琰,李康顺,杨磊.加入动态惩罚因子的GEP自动聚类算法[J].系统仿真学报,2016,28(4):806-814. 被引量：1
9潘章明.半监督的自动聚类[J].计算机应用,2010,30(10):2614-2617. 被引量：2
10李阳,马骊,樊锁海.基于动态近邻的DBSCAN算法[J].计算机工程与应用,2016,52(20):80-85. 被引量：7

计算机工程

2008年第23期

浏览历史

内容加载中请稍等...

基于不均匀密度的自动聚类算法被引量：3

参考文献5

二级参考文献8

共引文献107

同被引文献28

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于不均匀密度的自动聚类算法 被引量：3

参考文献5

二级参考文献8

共引文献107

同被引文献28

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于不均匀密度的自动聚类算法被引量：3