-
题名文档级神经机器翻译综述
- 1
-
-
作者
吕星林
李军辉
陶仕敏
杨浩
张民
-
机构
苏州大学计算机科学与技术学院
华为翻译中心
-
出处
《软件学报》
北大核心
2025年第1期152-183,共32页
-
基金
国家自然科学基金(62036004)
江苏高校优势学科建设工程。
-
文摘
机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到端的神经机器翻译(neural machine translation,NMT)方法显著超越了统计机器翻译(statistical machine translation,SMT)方法,成为目前机器翻译研究的主流方法.然而,神经机器翻译系统通常以句子为翻译单位,在面向文档的翻译场景中,将文档中每个句子独立地进行翻译,会因脱离文档的篇章语境引起一些篇章级的错误,如词语错翻、句子间不连贯等.因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法,文档级的神经机器翻译(document-level neural machine translation,DNMT)的目标正是如此,成为机器翻译研究的热门方向.调研了近年来在文档级神经机器翻译研究方向的主要工作,从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述,目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向.同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战,希望能带给研究者们一些启发.
-
关键词
神经机器翻译
Transformer模型
文档上下文
篇章评测
-
Keywords
neural machine translation
Transformer
document-level context
discourse evaluation
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-