-
题名基于中文文本分类的分词方法研究
被引量:22
- 1
-
-
作者
湛燕
陈昊
袁方
王熙照
-
机构
河北大学数学与计算机科学学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第23期87-88,91,共3页
-
基金
河北省自然科学基金(编号:698139)
河北省教育厅科研计划项目(编号:2001206)
-
文摘
文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作分词系统的研究是很有意义的。该文主要提出了一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统,旨在通过新的分词方法提供更加准确的分词率,同时提高系统实现效率。
-
关键词
文本分类
分词
查询
数据库
主题词
-
Keywords
text classification,word segmentation,query,database,thematic words
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
TP311
[自动化与计算机技术—计算机软件与理论]
-