期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于用字共现频率统计的外国译名自动识别 被引量:1
1
作者 陈阳 赵跃华 程显毅 《计算机工程与设计》 CSCD 北大核心 2012年第1期362-366,共5页
为了减少分词的负面效果,提出了基于用字共现频率统计的外国译名自动识别方法。对译名的用字特征进行了统计,提出译名共现字串的概念,并由译名用字表与汉语常用字表得到了非译名用字表。在上述工作的基础上定义了译名的边界,在边界定义... 为了减少分词的负面效果,提出了基于用字共现频率统计的外国译名自动识别方法。对译名的用字特征进行了统计,提出译名共现字串的概念,并由译名用字表与汉语常用字表得到了非译名用字表。在上述工作的基础上定义了译名的边界,在边界定义的基础上设计了一种对分词错误的调整方法。对开放语料的测试结果表明,与最大词频分词算法相比,该算法在译名识别中的准确率、召回率、F值均有所提高。 展开更多
关键词 外国译名 分词 共现字串 频率统计 译名边界 自然语言处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部