期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文合成词识别及分词修正 被引量:4
1
作者 刘兴林 郑启伦 马千里 《计算机应用研究》 CSCD 北大核心 2011年第8期2905-2908,共4页
提出一种中文合成词识别及分词修正方法。该方法先采用词性探测从文本中提取词串,进而由提取到的词串生成词共现有向图,借鉴Bellman-Ford算法思想,设计了运行在词共现有向图中识别合成词的算法,即搜索多源点长度最长、权重值满足给定条... 提出一种中文合成词识别及分词修正方法。该方法先采用词性探测从文本中提取词串,进而由提取到的词串生成词共现有向图,借鉴Bellman-Ford算法思想,设计了运行在词共现有向图中识别合成词的算法,即搜索多源点长度最长、权重值满足给定条件的路径,则该路径所对应的词串为合成词。最后,采用核心属性渗透理论对合成词标注词性,同时修正分词结果。实验结果表明,合成词识别正确率达到了91.60%,且分词修正效果良好。 展开更多
关键词 合成词 词共现有向图 词性标注 分词修正 自然语言处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部