期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于用字共现频率统计的外国译名自动识别
被引量:
1
1
作者
陈阳
赵跃华
程显毅
《计算机工程与设计》
CSCD
北大核心
2012年第1期362-366,共5页
为了减少分词的负面效果,提出了基于用字共现频率统计的外国译名自动识别方法。对译名的用字特征进行了统计,提出译名共现字串的概念,并由译名用字表与汉语常用字表得到了非译名用字表。在上述工作的基础上定义了译名的边界,在边界定义...
为了减少分词的负面效果,提出了基于用字共现频率统计的外国译名自动识别方法。对译名的用字特征进行了统计,提出译名共现字串的概念,并由译名用字表与汉语常用字表得到了非译名用字表。在上述工作的基础上定义了译名的边界,在边界定义的基础上设计了一种对分词错误的调整方法。对开放语料的测试结果表明,与最大词频分词算法相比,该算法在译名识别中的准确率、召回率、F值均有所提高。
展开更多
关键词
外国
译名
分词
共现字串
频率统计
译名边界
自然语言处理
在线阅读
下载PDF
职称材料
题名
基于用字共现频率统计的外国译名自动识别
被引量:
1
1
作者
陈阳
赵跃华
程显毅
机构
江苏大学计算机科学与通信工程学院
南通大学计算机科学与技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2012年第1期362-366,共5页
基金
国家自然科学基金项目(60702056)
文摘
为了减少分词的负面效果,提出了基于用字共现频率统计的外国译名自动识别方法。对译名的用字特征进行了统计,提出译名共现字串的概念,并由译名用字表与汉语常用字表得到了非译名用字表。在上述工作的基础上定义了译名的边界,在边界定义的基础上设计了一种对分词错误的调整方法。对开放语料的测试结果表明,与最大词频分词算法相比,该算法在译名识别中的准确率、召回率、F值均有所提高。
关键词
外国
译名
分词
共现字串
频率统计
译名边界
自然语言处理
Keywords
transliterated name
segmentation
co-occurrence string
frequency statistics
boundary of transliterated name; natural language processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于用字共现频率统计的外国译名自动识别
陈阳
赵跃华
程显毅
《计算机工程与设计》
CSCD
北大核心
2012
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部