-
题名基于伪孪生网络的无监督学习多语言神经机器翻译方法
- 1
-
-
作者
都力铭
屈丹
张传财
席阳丽
-
机构
郑州大学网络空间安全学院
网络空间部队信息工程大学先进计算与智能工程(国家级)实验室
-
出处
《郑州大学学报(工学版)》
北大核心
2025年第6期8-14,共7页
-
基金
国家自然科学基金资助项目(62171470)
河南省中原科技创新领军人才项目(234200510019)
河南省自然科学基金项目(232300421240)。
-
文摘
无监督神经机器翻译采用单语数据进行训练时会产生大量噪音信息,使得机器翻译模型在训练迭代过程中的误差不断积累,影响翻译效果。针对此问题,在跨语言预训练模型(XLM)的基础上,提出了一种基于伪孪生网络的无监督神经机器翻译方法。该方法将模型编码器分为两个模块,其中伪孪生网络部分引入了一种噪声过滤门机制,利用其对编码过程中的噪音特征进行过滤,使得模型能够更好地学习源语言和目标语言之间的映射关系。实验结果表明:在英语同德语、法语、罗马尼亚语3种语言之间的交互翻译任务中,所提方法相较于基线系统平均提升了3.5百分点,证明了其翻译效果的优越性,并使用消融实验对该模型各组件进行了有效性验证,同时在德译英翻译任务中模拟了该方法在不同噪声条件下的性能测试,表现出较好的抗噪性。
-
关键词
无监督机器翻译
伪孪生网络
单语数据
噪声过滤门机制
跨语言预训练模型
-
Keywords
unsupervised machine translation
pseudo-siamese network
monolingual data
noise filtering gate mechanism
cross-language pretraining model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-