期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融入语言差异化特征的汉越神经机器翻译译文质量估计 被引量:3
1
作者 邹翔 朱俊国 +2 位作者 高盛祥 余正涛 杨福岸 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1413-1418,共6页
译文质量估计是机器翻译领域中一个重要的子任务,该任务旨在不依靠参考译文的情况下对机器译文进行质量分析.当前,译文质量估计任务在汉英、英德机器翻译上有较好的表现,技术相对成熟.但是将模型应用到汉-越神经机器翻译中面临较多问题... 译文质量估计是机器翻译领域中一个重要的子任务,该任务旨在不依靠参考译文的情况下对机器译文进行质量分析.当前,译文质量估计任务在汉英、英德机器翻译上有较好的表现,技术相对成熟.但是将模型应用到汉-越神经机器翻译中面临较多问题.尤其是译文质量估计模型在汉越平行数据中提取到的语言特征不能够充分地体现汉语与越南语之间的语言特点,加之汉语与越南语之间语序与句法结构也存在明显的差异.针对上述问题,本文采用统计对齐的方法对汉越之间结构差异进行建模,提取汉语与越南语之间的语言差异化特征,以提升汉越译文质量估计的效果.实验结果表明,融入语言差异化特征在汉-越和越-汉两个方向上较基线模型分别提升了0.52个百分点和0.35个百分点. 展开更多
关键词 质量估计 汉越平行数据 语言特点 差异化特征 汉-越神经机器翻译
在线阅读 下载PDF
低频词表示增强的低资源神经机器翻译 被引量:7
2
作者 朱俊国 杨福岸 +2 位作者 余正涛 邹翔 张泽锋 《中文信息学报》 CSCD 北大核心 2022年第6期44-51,共8页
在神经机器翻译过程中,低频词是影响翻译模型性能的一个关键因素。由于低频词在数据集中出现次数较少,训练经常难以获得准确的低频词表示,该问题在低资源翻译中的影响更为突出。该文提出了一种低频词表示增强的低资源神经机器翻译方法... 在神经机器翻译过程中,低频词是影响翻译模型性能的一个关键因素。由于低频词在数据集中出现次数较少,训练经常难以获得准确的低频词表示,该问题在低资源翻译中的影响更为突出。该文提出了一种低频词表示增强的低资源神经机器翻译方法。该方法的核心思想是利用单语数据上下文信息来学习低频词的概率分布,并根据该分布重新计算低频词的词嵌入,然后在所得词嵌入的基础上重新训练Transformer模型,从而有效缓解低频词表示不准确问题。该文分别在汉越和汉蒙两个语言对四个方向上分别进行实验,实验结果表明,该文提出的方法相对于基线模型均有显著的性能提升。 展开更多
关键词 低频词表示 信息增强 低资源 神经机器翻译
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部