期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合EMD最小化双语词典的汉—越无监督神经机器翻译 被引量:4
1
作者 薛明亚 余正涛 +1 位作者 文永华 于志强 《中文信息学报》 CSCD 北大核心 2021年第3期43-50,共8页
神经机器翻译在平行语料充足的任务中能取得很好的效果,然而对于资源稀缺型语种的翻译任务则往往效果不佳。汉语和越南语之间没有大规模的平行语料库,在这项翻译任务中,该文探索只使用容易获得的汉语和越南语单语语料,通过挖掘单语语料... 神经机器翻译在平行语料充足的任务中能取得很好的效果,然而对于资源稀缺型语种的翻译任务则往往效果不佳。汉语和越南语之间没有大规模的平行语料库,在这项翻译任务中,该文探索只使用容易获得的汉语和越南语单语语料,通过挖掘单语语料中词级别的跨语言信息,融合到无监督翻译模型中提升翻译性能;该文提出了融合EMD(Earth Mover’s Distance)最小化双语词典的汉—越无监督神经机器翻译方法,首先分别训练汉语和越南语的单语词嵌入,通过最小化它们的EMD训练得到汉越双语词典,然后再将该词典作为种子词典训练汉越双语词嵌入,最后利用共享编码器的无监督机器翻译模型构建汉—越无监督神经机器翻译方法。实验表明,该方法能有效提升汉越无监督神经机器翻译的性能。 展开更多
关键词 无监督学习 EMD 汉语—越南语 神经机器翻译
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部