期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于句对质量和覆盖度的统计机器翻译训练语料选取 被引量:11
1
作者 姚树杰 肖桐 朱靖波 《中文信息学报》 CSCD 北大核心 2011年第2期72-77,共6页
该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规... 该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规模训练子集的方法。在CWMT2008汉英翻译任务上的实验结果表明,利用本文的方法能够从现有大规模语料中选取高质量的子集,在减少80%训练语料的情况下达到与Baseline系统(使用全部训练语料)相当的翻译性能(BLEU值)。 展开更多
关键词 句对质量评价 覆盖度 统计机器翻译 线性句对质量评价模型 训练语料选取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部