期刊文献+

基于主题的中文短信文本分类研究 被引量:14

Study on Chinese Short Message Text Classification Based on Theme
在线阅读 下载PDF
导出
摘要 根据中文短信文本分类的特点,提出同义概念归并、上下位概念的聚焦以及短信文本重点词汇的确定方法,利用主题句选取算法获取短信文本的主题,采用KNN算法将短信文本的主题进行分类。仿真实验结果表明,该算法能够有效提高短信文本的分类速度。 According to characteristics of Chinese short message text categorization, some contents are proposed, such as the synonymy concept merging, the superior concept and sub-concept semantic focusing and using of topic sentences. The algorithm getting theme of short text is used to obtain the text theme. KNN algorithm is also used to classify the short text subject. Simulation experimental results show this algorithm can improve the classification speed of the short text.
作者 刘金岭
出处 《计算机工程》 CAS CSCD 北大核心 2010年第4期30-32,共3页 Computer Engineering
基金 国家自然科学基金资助项目(60632050) 江苏省高校自然科学基金资助项目(06KJD520024) 淮安市科技基金资助项目(HAG09061)
关键词 短信文本 KNN算法 主题句 short message text KNN algorithm theme sentence
作者简介 刘金岭(1958-),男,教授,主研方向:数据仓库,文本数据挖掘. E-mail:liujinlingg@126.com
  • 相关文献

参考文献5

二级参考文献18

  • 1李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量:93
  • 2王军.词表的自动丰富——从元数据中提取关键词及其定位[J].中文信息学报,2005,19(6):36-43. 被引量:40
  • 3索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量:88
  • 4刘佳宾,陈超,邵正荣,吉翔华.基于机器学习的科技文摘关键词自动提取方法[J].计算机工程与应用,2007,43(14):170-172. 被引量:15
  • 5Liu Qun, Li Sujian. Word Similarity Computing Based on How-net Computational[J]. Linguistics and Chinese Language Processing, 2002, 7(2): 59-76.
  • 6[1]Apte C, Damerau F. Automated learning of decision rules for text categorization [J]. ACM Transaction on Information System, 1994, 12(3): 233251.
  • 7[2]Chute C G. An example based mapping method for text categorization and retrieval [J]. ACM Transaction on Information System, 1994, 12(3): 252277.
  • 8[3]Turle H, Croft B. Evaluation of an inference network net-based Retrieval Model [J]. ACM Transaction on Information System, 1991, 9(3): 187222.
  • 9[4]Mostafa J, Mukhopadhyay S, Lam W. A multilevel approach to intelligent information filtering: model, system and evaluation [J]. ACM Transaction on Information System, 1997, 15(4): 368399.
  • 10[5]Cohen W, Singer Y. Context-sensitive learning methods for text categorization [J]. ACM Transaction on Information System, 1999, 17(2): 141173.

共引文献98

同被引文献129

引证文献14

二级引证文献104

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部