期刊文献+

基于LSA降维的KNN文本分类算法 被引量:7

An algorithm of KNN text categorization based on LSA reduce dimensionality
在线阅读 下载PDF
导出
摘要 针对文本自动分类问题,提出了一种基于LSA降维的KNN改进算法.通过对文本特征向量运用LSA理论进行降维处理,可以有效提高KNN算法的运行效率,提高分类精度.实验证明,改进的KNN算法具有很好的性能. Aimed at the problem of document automatic classification,an algorithm is proposed based on LSA and KNN.It advances the KNN algorithm's efficiency and classifier's precision by using LSA to reduce dimensionality of text feature matrix.The experiment result shows that it has good performance.
出处 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2007年第2期33-36,共4页 Journal of Northeast Normal University(Natural Science Edition)
基金 国家"十五"科技攻关计划项目(2004BA721A05)
关键词 潜在语义分析 KNN 文本分类 降维 latent semantic analysis KNN text categorization reduce dimensionality
作者简介 李良俊(1967-),男,博士研究生,副教授,主要从事数据挖掘、神经网络研究; 张斌(1964-),男,教授,博士研究生导师,主要从事语义Web,网格技术和数据挖掘等研究.
  • 相关文献

参考文献7

  • 1YANG Y,LIU X.A re-examination of text caregorization methods[A].In Proceedings,22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval(SIGIR'99)[C].Berkeley:ACM Press,1999:42-49.
  • 2SLATON G.Automatic text processing:the transformation,analysis,and retrieval of information by computer[M].MA:Addison-Wesley,Publishing,1989.
  • 3LANDAUER T K.A solution to plato's problem:the latent semantic analysis theory of the acquisition,and representation of knowledge[J].Psychological Review,1997,104:211-240.
  • 4林鸿飞.基于示例的文本标题分类机制[J].计算机研究与发展,2001,38(9):1132-1136. 被引量:17
  • 5LANDAUER T K,FOLTZ P W,LAHAM D.Introduction to latent semantic analysis[J].Discourse Processes,1998,25:259-284.
  • 6张剑飞,王辉,周颜军,王双成.基于局部优化具有连续变量的贝叶斯网络结构学习[J].东北师大学报(自然科学版),2006,38(1):27-30. 被引量:5
  • 7解冲锋,李星.补偿型的Sleeping expert文本分类算法[J].清华大学学报(自然科学版),2001,41(7):39-42. 被引量:6

二级参考文献22

  • 1王辉,张剑飞,王双成.基于预测能力的贝叶斯网络结构学习[J].东北师大学报(自然科学版),2005,37(1):32-35. 被引量:8
  • 2陈磊.基于HNC语义分析的中文标题分类方法.计算语言学文集[M].北京:清华大学出版社,1999.371-375.
  • 3战学钢 姚天顺.基于汉语分析的中文标题分类方法.中文信息处理国际会议论文集[M].北京:清华大学出版社,1998.321-324.
  • 4-.中国分类主题词表,分类号-主题词对应表,第一卷[M].北京:华艺出版社,1994..
  • 5-.中国分类主题词表,主题词-分类号对应表,第二卷[M].北京:华艺出版社,1994..
  • 6[1]Apte C, Damerau F. Automated learning of decision rules for text categorization [J]. ACM Transaction on Information System, 1994, 12(3): 233251.
  • 7[2]Chute C G. An example based mapping method for text categorization and retrieval [J]. ACM Transaction on Information System, 1994, 12(3): 252277.
  • 8[3]Turle H, Croft B. Evaluation of an inference network net-based Retrieval Model [J]. ACM Transaction on Information System, 1991, 9(3): 187222.
  • 9[4]Mostafa J, Mukhopadhyay S, Lam W. A multilevel approach to intelligent information filtering: model, system and evaluation [J]. ACM Transaction on Information System, 1997, 15(4): 368399.
  • 10[5]Cohen W, Singer Y. Context-sensitive learning methods for text categorization [J]. ACM Transaction on Information System, 1999, 17(2): 141173.

共引文献25

同被引文献75

引证文献7

二级引证文献26

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部