期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
带标记音节的双向维汉神经机器翻译方法 被引量:3
1
作者 艾山·吾买尔 斯拉吉艾合麦提·如则麦麦提 +4 位作者 西热艾力·海热拉 刘文其 吐尔根·依布拉音 汪烈军 瓦依提·阿不力孜 《计算机工程与应用》 CSCD 北大核心 2021年第4期161-168,共8页
近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战。针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,从维吾尔语的音节特点出发,将单词切分成音节,... 近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战。针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,从维吾尔语的音节特点出发,将单词切分成音节,同时融入BME(Begin,Middle,End)标记思想,提出一种基于带标记音节的神经网络机器翻译方法。与使用单词粒度和BPE粒度的两类神经网络机器翻译方法对比,该方法在维-汉机器翻译任务中分别提升7.39与3.04个BLEU值,在汉-维机器翻译任务中分别提升5.82与3.09个BLEU值,可见在平行语料不足的条件下,该方法有效地提升了维-汉机器翻译的质量。 展开更多
关键词 神经机器翻译 数据稀疏 音节粒度 维汉神经机器翻译
在线阅读 下载PDF
低资源维汉神经机器翻译研究 被引量:3
2
作者 王坤 殷明明 +8 位作者 俞鸿飞 韩冬 斯拉吉艾合麦提·如则麦麦提 西热艾力·海热拉 刘文其 艾山·吾买尔 李军辉 段湘煜 张民 《江西师范大学学报(自然科学版)》 CAS 北大核心 2019年第6期638-642,共5页
该文介绍了在第15届全国机器翻译大会的机器翻译评测项目中苏州大学的参赛情况,主要介绍参评系统使用的神经机器翻译模型基准结构以及采用的策略、方法,并介绍该系统在评测数据上的实验性能.
关键词 神经机器翻译 维汉翻译 低资源机器翻译
在线阅读 下载PDF
神经机器翻译面对句长敏感问题的研究 被引量:1
3
作者 阿里木·赛买提 斯拉吉艾合麦提·如则麦麦提 +3 位作者 甫热提 艾山·吾买尔 吾守尔·斯拉木 吐尔根·依不拉音 《计算机工程与应用》 CSCD 北大核心 2022年第9期195-200,共6页
随着深度学习的发展神经网络机器翻译有了长足的进步。众所周知,神经机器翻译方法对句子长度比较敏感。为了充分利用海量平行语料,考虑平行语料句子长度信息,把原平行语料划分若干个模块,为每一个模块训练一个子模型,提出一种按句子长... 随着深度学习的发展神经网络机器翻译有了长足的进步。众所周知,神经机器翻译方法对句子长度比较敏感。为了充分利用海量平行语料,考虑平行语料句子长度信息,把原平行语料划分若干个模块,为每一个模块训练一个子模型,提出一种按句子长度融合策略的神经机器翻译方法。当训练结束时,通过句长边界划分后的模型融合与三特征(困惑度、句长比与分类器)融合排序方法得到译文。实验结果表明,提出的方法在三个不同测试集上英中任务中平均提高了1.2左右的BLEU点,维汉任务中提升了0.4至0.6的BLEU点。说明该方法具有一定的参考意义。 展开更多
关键词 机器翻译 极端句长数据 困惑度 融合 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部