期刊文献+

一个可扩展的文本分类系统的设计与实现 被引量:2

The Design and Implementation of An Extensible Text Categorization System
在线阅读 下载PDF
导出
摘要 论文在研究各种分类算法的基础上,总结了分类系统的一般流程和框架,设计并实现了一个适应性很强的可扩展的分类系统THTC。它利用面向对象技术构造,采用了一些常用的设计模式。实验证明,该系统性能与同类算法相当,能够兼容各种不同的算法和适应不同的文档,具有较强的可扩展性。 In this paper,we first summarize the common process and architecture of text categorization systems,and then design and implement an extensible text categorization system THTC.This system is built with Object-Oriented technology.In building this system,we adopt some good design patterns.The experiment shows that the THTC system has compatible performance with similar system and high extensibility.
出处 《计算机工程与应用》 CSCD 北大核心 2004年第30期102-106,共5页 Computer Engineering and Applications
基金 国家863高技术研究发展计划项目:面向领域的数据分析与挖掘技术研究(编号:2002AA444120)
关键词 文本分类 面向对象 设计模式 可扩展性 text categorization,Object-Oriented,design pattern,extensibility
  • 相关文献

参考文献13

二级参考文献27

  • 1吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量:24
  • 2赵伯璋 徐力.计算机中文信息处理(下册)[M].北京:宇航出版社,1988..
  • 3周水庚.中文文本数据库的若干关键技术研究:博士论文[M].上海:复旦大学,2000..
  • 4黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 5鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 6卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 7俞士汶,1994年
  • 8周强,计算机研究与运用,1993年
  • 9白栓虎,1992年
  • 10刘开瑛,1992年

共引文献476

同被引文献5

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部