期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于伪数据的机器翻译质量估计模型的训练 被引量:3
1
作者 吴焕钦 张红阳 +3 位作者 李静梅 朱俊国 杨沐昀 李生 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期279-285,共7页
为向基于深度学习的机器翻译质量估计模型提供高效的训练数据,提出面向目标数据集的伪数据构造方法,采用基于伪数据预训练与模型精调相结合的两阶段模型训练方法对模型进行训练,并针对不同伪数据规模设计实验。结果表明,在构造得到的伪... 为向基于深度学习的机器翻译质量估计模型提供高效的训练数据,提出面向目标数据集的伪数据构造方法,采用基于伪数据预训练与模型精调相结合的两阶段模型训练方法对模型进行训练,并针对不同伪数据规模设计实验。结果表明,在构造得到的伪数据下,利用两阶段训练方法训练得到的机器翻译质量估计模型给出的得分与人工评分的相关性有显著的提升。 展开更多
关键词 机器翻译质量估计 深度学习 伪数据
在线阅读 下载PDF
基于QE的机器翻译重排序方法研究 被引量:12
2
作者 翟煜锦 李培芸 +4 位作者 项青宇 李茂西 裘白莲 钟茂生 王明文 《江西师范大学学报(自然科学版)》 CAS 北大核心 2020年第1期46-50,88,共6页
该文提出了一种融合BERT语境向量的多模型集成的翻译质量估计方法,以及基于译文质量估计的多候选译文重排序方法,实验结果表明,这2种方法均取得了较好的实验效果.
关键词 机器翻译 机器翻译质量估计 重排序 编码器-解码器模型 卷积神经网络
在线阅读 下载PDF
基于翻译质量估计的神经网络译文自动后编辑 被引量:2
3
作者 谭亦鸣 王明文 李茂西 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期255-261,共7页
针对译文后编辑中的过度修正问题,提出利用神经网络自动后编辑方法,训练专门用于提供少量复合编辑修正和单一编辑类型修正的神经网络后编辑模型。在此基础上,通过建立一个基于翻译质量估计的译文筛选算法,将提出的模型与常规的神经网络... 针对译文后编辑中的过度修正问题,提出利用神经网络自动后编辑方法,训练专门用于提供少量复合编辑修正和单一编辑类型修正的神经网络后编辑模型。在此基础上,通过建立一个基于翻译质量估计的译文筛选算法,将提出的模型与常规的神经网络自动后编辑模型进行联合。在WMT16自动后编辑任务测试集上的实验结果表明,与基准系统相比,所提方法显著提高了机器译文的翻译质量,实验分析也表明该方法能有效地处理过度修正造成的译文质量下降问题。 展开更多
关键词 译文自动后编辑 神经机器翻译 机器翻译质量估计 过度修正
在线阅读 下载PDF
基于神经网络特征的句子级别译文质量估计 被引量:15
4
作者 陈志明 李茂西 王明文 《计算机研究与发展》 EI CSCD 北大核心 2017年第8期1804-1812,共9页
机器翻译质量估计是自然语言处理中的一个重要任务,与传统的机器翻译自动评价方法不同,译文质量估计方法评估机器译文的质量不使用人工参考译文.针对目前句子级别机器译文质量估计特征提取严重依赖语言学分析导致泛化能力不足,并且制约... 机器翻译质量估计是自然语言处理中的一个重要任务,与传统的机器翻译自动评价方法不同,译文质量估计方法评估机器译文的质量不使用人工参考译文.针对目前句子级别机器译文质量估计特征提取严重依赖语言学分析导致泛化能力不足,并且制约着后续支持向量回归算法的性能,提出了利用深度学习中上下文单词预测模型和矩阵分解模型提取句子向量特征,并将其与递归神经网络语言模型特征相结合来提高译文质量自动估计与人工评价的相关性.在WMT15和WMT16译文质量估计子任务数据集上的实验结果表明:利用上下文单词预测模型提取句子向量特征的方法性能统计一致地优于传统的QuEst方法和连续空间语言模型句子向量特征提取方法,这揭示了提出的特征提取方法不仅不需要语言学分析,而且显著地提高了译文质量估计的效果. 展开更多
关键词 机器翻译质量估计 句子级别 词向量 递归神经网络语言模型 支持向量回归
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部