-
题名融合零指代识别的篇章级机器翻译
被引量:2
- 1
-
-
作者
汪浩
李军辉
贡正仙
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2023年第8期25-33,共9页
-
文摘
在汉语等其他有省略代词习惯的语言中,通常会省略可从上下文信息推断出的代词。尽管以Transformer为代表的的神经机器翻译模型取得了巨大的成功,但这种代词省略现象依旧使神经机器翻译模型面临很大的挑战。该文在Transformer模型基础上提出了一个融合零指代识别的翻译模型,并引入篇章上下文来丰富指代信息。具体地,该模型采用联合学习的框架,在翻译模型基础上,联合了一个分类任务,即判别句子中省略代词在句子所表示的成分,使得模型能够融合零指代信息辅助翻译。通过在中英对话数据集上的实验,验证了该文所提出方法的有效性,与基准模型相比,翻译性能提升了1.48个BLEU值。
-
关键词
零指代
篇章级机器翻译
联合学习
-
Keywords
zero pronoun
context-aware machine translation
joint learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于联合注意力机制的篇章级机器翻译
被引量:6
- 2
-
-
作者
李京谕
冯洋
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院大学
-
出处
《中文信息学报》
CSCD
北大核心
2019年第12期45-53,共9页
-
文摘
近年来,神经机器翻译(neural machine translation,NMT)表现出极大的优越性,然而如何在翻译一个文档时考虑篇章上下文信息仍然是一个值得探讨的问题。传统的注意力机制对源端的所有词语进行计算,而在翻译当前句子时篇章中大量的信息中只有小部分是与之相关的。在篇章级机器翻译中,采用传统的注意力机制建模篇章信息存在着信息冗余的问题。该文提出了一种联合注意力机制,结合"硬关注"和"软关注"的机制对篇章上下文的信息进行建模。关键思想是通过"硬关注"筛选出与翻译当前句子相关的源端历史词语,然后采用"软关注"的方法进一步抽取翻译中所需的上下文信息。实验表明,相比于基线系统,该方法能使翻译性能获得明显提升。
-
关键词
神经机器翻译
注意力机制
篇章级机器翻译
-
Keywords
neural machine translation
attention mechanism
document-level neural machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名神经机器翻译综述
被引量:8
- 3
-
-
作者
章钧津
田永红
宋哲煜
郝宇峰
-
机构
内蒙古工业大学数据科学与应用学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第4期57-74,共18页
-
基金
内蒙古自治区自然科学基金(2020MS06026)。
-
文摘
机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器翻译、基于统计的机器翻译和基于深度学习的机器翻译三种方法进行对比总结;然后引出神经机器翻译,并对其常见的类型进行讲解;接着选取多模态机器翻译、非自回归机器翻译、篇章级机器翻译、多语言机器翻译、数据增强技术和预训练模型六个主要的神经机器翻译研究领域进行重点介绍;最后从低资源语言、上下文相关翻译、未登录词和大模型四个方面对神经机器翻译的未来进行了展望。通过系统性的介绍以更好地理解神经机器翻译的发展现状。
-
关键词
机器翻译
神经机器翻译
篇章级机器翻译
数据增强
预处理技术
-
Keywords
machine translation
neural machine translation
document-level machine translation
data augmentation
preprocessing technique
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名融合指代消解的神经机器翻译研究
- 4
-
-
作者
冯勤
贡正仙
李军辉
周国栋
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2024年第6期67-76,共10页
-
基金
国家自然科学基金(61976148)。
-
文摘
篇章中的同一实体经常会呈现出不同的表述,形成一系列复杂的指代关系,这给篇章翻译带来了很大的挑战。该文重点探索指代消解和篇章神经机器翻译的融合方案,首先为指代链设计相应的指代表征;其次使用软约束和硬约束两种方法在翻译系统中实现指代信息的融合。该文建议的方法分别在英语-德语和中文-英语语言对上进行了实验,实验结果表明,相比于同期最好的句子级翻译系统,该方法能使翻译性能获得明显提升。此外,在英语-德语的代词翻译质量的专门评估中,准确率也有显著提升。
-
关键词
指代表征
神经机器翻译
篇章级机器翻译
-
Keywords
reference representation
neural machine translation
document-level machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-