期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于句对质量和覆盖度的统计机器翻译训练语料选取
被引量:
11
1
作者
姚树杰
肖桐
朱靖波
《中文信息学报》
CSCD
北大核心
2011年第2期72-77,共6页
该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规...
该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规模训练子集的方法。在CWMT2008汉英翻译任务上的实验结果表明,利用本文的方法能够从现有大规模语料中选取高质量的子集,在减少80%训练语料的情况下达到与Baseline系统(使用全部训练语料)相当的翻译性能(BLEU值)。
展开更多
关键词
句对质量评价
覆盖度
统计机器翻译
线性
句对质量评价
模型
训练语料选取
在线阅读
下载PDF
职称材料
题名
基于句对质量和覆盖度的统计机器翻译训练语料选取
被引量:
11
1
作者
姚树杰
肖桐
朱靖波
机构
东北大学自然语言处理实验室
医学影像计算教育部重点实验室(东北大学)
出处
《中文信息学报》
CSCD
北大核心
2011年第2期72-77,共6页
基金
国家自然科学基金资助项目(60873091
61073140)
+1 种基金
中央高校基本科研业务费专项资金
高等学校博士学科点专项科研基金资助(20100042110031)
文摘
该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规模训练子集的方法。在CWMT2008汉英翻译任务上的实验结果表明,利用本文的方法能够从现有大规模语料中选取高质量的子集,在减少80%训练语料的情况下达到与Baseline系统(使用全部训练语料)相当的翻译性能(BLEU值)。
关键词
句对质量评价
覆盖度
统计机器翻译
线性
句对质量评价
模型
训练语料选取
Keywords
sentence pair quality evaluation
coverage
statistical machine translation
linear sentence pair quality evaluation model
training data selection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于句对质量和覆盖度的统计机器翻译训练语料选取
姚树杰
肖桐
朱靖波
《中文信息学报》
CSCD
北大核心
2011
11
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部