-
题名中文分词及词性标注一体化模型研究
被引量:10
- 1
-
-
作者
佟晓筠
宋国龙
刘强
张俐
姜伟
-
机构
哈尔滨工业大学(威海)计算机科学与技术学院
东北大学信息科学与工程学院
辽东学院计算中心
-
出处
《计算机科学》
CSCD
北大核心
2007年第9期174-175,212,共3页
-
基金
2002年山东省科技发展计划项目基金资助(项目号:2002-276-022090104)
-
文摘
本文应用N-最短路径法,构造了一种中文自动分词和词性自动标注一体化处理的模型,在分词阶段召回N个最佳结果作为候选集,最终的结果会在未登录词识别和词性标注之后,从这N个最有潜力的候选结果中选优得到,并基于该模型实现了一个中文自动分词和词性自动标注一体化处理的中文词法分析器。初步的开放测试证明,该分析器的分词准确率和词性标注准确率分别达到98.1%和95.07%。
-
关键词
中文分词
词性标注
n-最短路径法
-
Keywords
Chinese word segmentation, Part-of-speech tagging, n-shortest paths method
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-