基于SS/OSF实现高维稀疏数据对象的聚类被引量：5

SS/OSF for High-Dimensional Sparse Data Object Clustering

在线阅读下载PDF

导出

摘要为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现.采用本方法得到高维稀疏数据对象的聚类结果后,可以根据聚类结果中各个对象集合的上确界和下确界为新对象进行对象组分类.实验表明,与传统K-means聚类方法相比,随着数据对象数目的增加,该方法无论是在运行时间上,还是在聚类结果的准确度方面都有明显的改进. Results of clustering are generally not ideal with traditional clustering method. Thus a SS/OSF clustering method is proposed for high-dimensional sparse data object based on set similarity （SS） and object set feature （OSF） with the addability of object set features. After the object clusters are gained by the SS/OSF clustering method, and according to the supremum and infimum of object clustering set, the new object can be distributed to all kinds of different clusters. Compared with the traditional K-means clustering method, the test results show that, as the number of object increases, the runtime and precision of results of the SS/OSF clustering method are seen to be clearly improved.

作者吴萍宋瀚涛牛振东张利萍张聚礼

机构地区北京理工大学计算机科学技术学院兰州理工大学计算机与通信学院甘肃

出处《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第3期216-220,共5页 Transactions of Beijing Institute of Technology

基金霍英东教育基金资助项目(91101) 科技部基础性工作专项资金资助项目(2002DEA20018)

关键词高维稀疏二态数据对象组相似度对象组特征向量聚类分类 high-dimensional sparse binary data set similarity object set feature clustering classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介吴萍（1972-）,女，在职博士生，E-mail：wuping@bit．edu．cn；宋瀚涛（1940-）,男，教授，博士生导师．

引文网络
相关文献

参考文献4

1Agrawal R.Automatic subspace clustering of high dimensional data mining applications[C]∥ Proceedings ACM SIGMOD International Conference on Management of Data.Washington:ACM Press,1998:94-105.
2Zhang Tian,Ramakrishnan R.BIRCH:an efficient data clustering method for very large databases[C]∥Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data.Montreal:ACM Press,1996:103-114.
3Wang Yitong,Kitsuregawa M.Use link-based clustering to improve Web search results[C]∥ Proceedings of the 2nd International Conference on Web Information Systems Engineering.Kyoto:IEEE Computer Society,2001:119-128.
4原野,沈钧毅.一种基于序列挖掘的分类系统框架[J].西安交通大学学报,2004,38(4):400-403. 被引量：1

二级参考文献5

1[1]Han J, Kambr M. Data mining concepts and techniques [M]. Beijing: Academic Press and Morgan Kaufmann Publishers, 2001.
2[2]Agrawal R, Srikant R. Mining sequential patterns [A]. The 11th Intl Conf on Data Mining, Taipei, 1995.
3[3]Zaki M J. Sequence mining in categorical domains: incorporating constraints [A]. The 9th Intl Conf on Information and Knowledge Management, Washington DC,2000.
4[4]Lesh N, Zaki M, Ogihara M. Mining features for sequence classification [A]. 5th Intl Conf on Knowledge Discovery and Data Mining , San Diego, 1999.
5[5]Yuan Ye, Song Qinbao, Shen Junyi. Automatic video classification using decision tree method [A]. Intel Conf on Machine Learning and Cybernetics, Beijing, 2002.

同被引文献42

1张少杰,王连芬.客户知识管理的数据挖掘方法[J].情报科学,2004,22(12):1413-1415. 被引量：7
2Ai-BoSong,Mao-XianZhao,Zuo-PengLiang,Yi-ShengDong,Jun-ZhouLuo.Discovering User Profiles for Web Personalized Recommendation[J].Journal of Computer Science & Technology,2004,19(3):320-328. 被引量：2
3冯凌,林杰,雷星晖.Web日志数据挖掘模型研究[J].计算机集成制造系统,2005,11(8):1073-1075. 被引量：8
4郏宣耀.基于相似性二次度量的高维数据聚类算法[J].计算机应用,2005,25(B12):176-177. 被引量：4
5赵亚琴,周献中,何新,王建宇.一种有效的高属性维稀疏数据聚类算法[J].模式识别与人工智能,2006,19(3):289-294. 被引量：6
6李卫平,张志鸿.万有引力定律在聚类中的应用[J].安阳工学院学报,2006,5(4):40-43. 被引量：3
7于红霞,汪波,钱荣.基于三维客户分类价值体系的客户关系管理研究[J].商业经济与管理,2006(11):43-47. 被引量：9
8宋江春,沈钧毅.一种新的Web用户群体和URL聚类算法的研究[J].控制与决策,2007,22(3):284-288. 被引量：11
9Han Jiawei.数据挖掘概念与技术[M].北京:机械工业出版社,2008.
10Aggarwal C C. Re-designing Distance Functions and Dis tance-Based Applications for High Dimensional Data[J]. ACM SIGMOD Record, 2001, 30(1):13-18.

引证文献5

1刘海峰,王元元,张学仁,刘守生.一种基于聚类和LSA相结合的文本特征降维方法[J].情报杂志,2008,27(2):3-6. 被引量：4
2谢明霞,郭建忠,张海波,陈科.高维数据相似性度量方法研究[J].计算机工程与科学,2010,32(5):92-96. 被引量：18
3赵洁,肖南峰,陈琼.基于知识粒度的高属性维稀疏聚类算法[J].华南理工大学学报（自然科学版）,2010,38(7):20-26. 被引量：2
4赵洁,董振宁,张沙清,肖南峰.一种基于粒度原理的多指标综合Web用户聚类算法[J].计算机应用研究,2011,28(7):2427-2431. 被引量：3
5赵洁,莫赞,刘洪伟,张沙清,董振宁.基于知识粒度的约简在Web使用挖掘中的应用研究[J].现代图书情报技术,2013(2):50-56.

二级引证文献27

1吴飞,吴兵,申志斌.新一代网络教学平台特征和技术难点的分析与探讨[J].开放教育研究,2009,15(1):10-20. 被引量：23
2艾英山,张德贤.基于文本和类别信息的KNN文本分类算法[J].计算机与数字工程,2009,37(11):10-12. 被引量：2
3朱颢东,钟勇.结合优化的文档频和LSA的特征选择方法[J].计算机工程与应用,2009,45(34):121-123. 被引量：1
4赵洁,董振宁,张沙清,肖南峰.一种基于粒度原理的多指标综合Web用户聚类算法[J].计算机应用研究,2011,28(7):2427-2431. 被引量：3
5熊红强,耿伯英,王文涛.海战场目标分群方法研究[J].电光与控制,2012,19(2):26-28. 被引量：2
6孙越林,包磊.基于D-S证据理论的海战场目标战术意图识别技术研究[J].舰船电子工程,2012,32(5):48-51. 被引量：14
7谢明霞,王家耀,郭建忠,陈科.不等距划分的高维相似性度量方法研究[J].武汉大学学报（信息科学版）,2012,37(7):780-783. 被引量：3
8王亚民,刘洋.含附件文本的分类算法研究[J].情报杂志,2012,31(8):161-165.
9林莽.林莽散文选[J].岁月,2000(7):27-29.
10赵洁,莫赞,刘洪伟,张沙清,董振宁.基于知识粒度的约简在Web使用挖掘中的应用研究[J].现代图书情报技术,2013(2):50-56.

1吴萍,张利萍.基于对象组特征向量的聚类与分类的实现[J].计算机工程,2006,32(16):17-19.
2李佐卿.OST及其分布式计算环境DCE[J].软件世界,1996(11):9-15.
3王玉生.OSF推出新的操作系统[J].计算机工程与应用,1991,27(8):66-67.
4周健,邹鹏.分布计算环境的实现技术[J].计算机工程与科学,1995,17(3):7-17.
5冯华.基于CORBA的分布式对象应用的实现[J].现代计算机,1998(4):27-30.
6孙玉方.OSF／DCE—OSF的分布式计算环境[J].计算机世界月刊,1991(9):65-67.
7吴坚.Motif—OSF／1的图形用户界面[J].中国计算机用户,1992(8):18-21.
8刘尚钟.OSF／1的内核基础—Mach[J].电子计算机,1993(2):30-33.
9陈幼松.UNIX最新版本OSF／1的特点[J].中国计算机用户,1992(2):52-53.
10刘尚钟.开放系统的又一成果—OSF／1[J].电子计算机,1993(2):24-29.

北京理工大学学报

2006年第3期

浏览历史

内容加载中请稍等...

基于SS/OSF实现高维稀疏数据对象的聚类被引量：5

参考文献4

二级参考文献5

同被引文献42

引证文献5

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于SS/OSF实现高维稀疏数据对象的聚类 被引量：5

参考文献4

二级参考文献5

同被引文献42

引证文献5

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于SS/OSF实现高维稀疏数据对象的聚类被引量：5