期刊文献+
共找到942篇文章
< 1 2 48 >
每页显示 20 50 100
基于标签句子重构的多语言零样本神经机器翻译
1
作者 陈潇 杨雅婷 +3 位作者 董瑞 时现伟 马博 吐尔洪·吾司曼 《中文信息学报》 北大核心 2025年第2期80-88,共9页
针对当前多语言零样本翻译的标签策略难以提供丰富的翻译方向信息和模型对语言建模能力的不足,进而导致翻译脱靶的问题,该文提出了使用标签句子重构的多语言零样本神经机器翻译方法。具体而言,首先提出了一种词级别的标签策略,在编码器... 针对当前多语言零样本翻译的标签策略难以提供丰富的翻译方向信息和模型对语言建模能力的不足,进而导致翻译脱靶的问题,该文提出了使用标签句子重构的多语言零样本神经机器翻译方法。具体而言,首先提出了一种词级别的标签策略,在编码器端增加目标语言标签嵌入,在源语言句子每个词的嵌入表示中注入目标语言信息;其次设计了标签句子重构任务,对句子添加噪声和使用词级别的标签策略后进行重构操作,以达到增强模型语言建模能力的目的。在MultiUN数据集和Europarl数据集上的零样本实验结果表明,所提方法在零样本翻译上的平均BLEU值分别超过强基线0.7和0.3。消融实验结果表明,所提出的语言标签嵌入策略和标签句子重构均能有效提升模型的零样本翻译性能。 展开更多
关键词 零样本机器翻译 多语言神经机器翻译 自然语言处理
在线阅读 下载PDF
融入实体翻译的汉越神经机器翻译模型
2
作者 高盛祥 侯哲 +1 位作者 余正涛 赖华 《计算机应用》 北大核心 2025年第1期69-74,共6页
在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源... 在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R(Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。 展开更多
关键词 汉越神经机器翻译 实体翻译 双语词典 指针网络 低资源
在线阅读 下载PDF
文档级神经机器翻译综述
3
作者 吕星林 李军辉 +2 位作者 陶仕敏 杨浩 张民 《软件学报》 北大核心 2025年第1期152-183,共32页
机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到... 机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到端的神经机器翻译(neural machine translation,NMT)方法显著超越了统计机器翻译(statistical machine translation,SMT)方法,成为目前机器翻译研究的主流方法.然而,神经机器翻译系统通常以句子为翻译单位,在面向文档的翻译场景中,将文档中每个句子独立地进行翻译,会因脱离文档的篇章语境引起一些篇章级的错误,如词语错翻、句子间不连贯等.因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法,文档级的神经机器翻译(document-level neural machine translation,DNMT)的目标正是如此,成为机器翻译研究的热门方向.调研了近年来在文档级神经机器翻译研究方向的主要工作,从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述,目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向.同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战,希望能带给研究者们一些启发. 展开更多
关键词 神经机器翻译 Transformer模型 文档上下文 篇章评测
在线阅读 下载PDF
利用压缩多语言BERT知识增强的低资源神经机器翻译
4
作者 朱嘉辉 韩韧 +1 位作者 张生 陈思州 《计算机工程与应用》 北大核心 2025年第8期163-172,共10页
利用BERT等预训练模型的上下文表示增强神经机器翻译,能够显著提升低资源翻译的效果。现有融合BERT的方法主要分为两大类,其一是初始化编码器参数并微调,其二是将上下文嵌入融入翻译模型。前者训练参数量大且容易受到灾难性遗忘的影响,... 利用BERT等预训练模型的上下文表示增强神经机器翻译,能够显著提升低资源翻译的效果。现有融合BERT的方法主要分为两大类,其一是初始化编码器参数并微调,其二是将上下文嵌入融入翻译模型。前者训练参数量大且容易受到灾难性遗忘的影响,后者融合的方法较为复杂。此外,这两类方法仅利用了源语言端的BERT表征,而未充分利用机器翻译的对偶特性。针对上述问题,提出一种线性复杂度的压缩注意力模块。通过可学习的压缩向量,压缩mBERT上下文嵌入并对齐到翻译模型的语义空间中。将压缩向量与编码器的输入向量拼接,从而增强源端语义表示。通过所提出的对偶多粒度训练的方式,同时增强翻译模型的双语表示能力。在IWSLT的两个公开低资源翻译口语数据集上的实验结果显示,相较于基线模型Transformer,该方法取得了2.07~2.66的BLEU值提升,验证了其有效性。 展开更多
关键词 mBERT知识增强 压缩注意力 低资源机器翻译 对偶训练
在线阅读 下载PDF
融合领域双语词典的泰-汉法律领域神经机器翻译方法
5
作者 李畅 高盛祥 余正涛 《厦门大学学报(自然科学版)》 北大核心 2025年第4期597-605,共9页
[目的]对于泰-汉法律领域神经机器翻译,由于训练所需平行语料稀缺,缺乏双语词级别的有效语义监督,难以做到一些实体词以及领域术语等领域关键词的精准翻译.针对该问题,本文提出一种融合领域双语词典的神经机器翻译方法.[方法]首先利用... [目的]对于泰-汉法律领域神经机器翻译,由于训练所需平行语料稀缺,缺乏双语词级别的有效语义监督,难以做到一些实体词以及领域术语等领域关键词的精准翻译.针对该问题,本文提出一种融合领域双语词典的神经机器翻译方法.[方法]首先利用法律领域语料库挖掘领域双语词典;然后使用基于不频繁法律领域中文词覆盖的方法筛选额外伪法律领域训练数据;在模型输入端,利用源句匹配的领域双语词典目标词构建额外提示数据;在模型结构中,引入提示浅编码器对提示进行表征,在源句编码器层中加入新的交叉注意力模块强化源句的表征,将源句表征与提示表征拼接作为最终编码器表征,在解码器端对编码器表征的交叉注意力作用下指导产生目标词序列.[结果]基于本文筛选方法混合训练的Transformer模型相比于仅用领域数据训练的模型,BLEU值提高了0.54个百分点;采用该混合训练集,融入提示信息的模型相比Transformer模型BLEU值又提升了0.90个百分点,并且相比于经典“语码转换”方法训练的模型BLEU值提升了0.61个百分点.[结论]本文数据筛选方法可在解决领域专业术语稀疏问题的同时降低通用高频词对翻译结果的干扰,提升领域翻译基线模型的性能;引入提示信息的模型能够有效地与提示进行交互,实现翻译性能的提升,并使领域关键词翻译更准确. 展开更多
关键词 法律领域 泰-汉神经机器翻译 领域双语词典 数据筛选 提示浅编码器 交叉注意力
在线阅读 下载PDF
词典释义增强的古文机器翻译
6
作者 李家欢 吴若纯 +4 位作者 黄书剑 胡文菁 陈冀轩 徐维潞 陈家骏 《中文信息学报》 北大核心 2025年第4期85-95,共11页
古文自动翻译技术可有效促进古籍的传承和发展,弘扬中华传统文化。然而,现有古籍翻译语料规模较小,知识缺乏,导致古文翻译系统性能不佳。该文提出使用词典注释资源增强古文翻译系统。作者收集古汉语常见汉字的释义,并设计了一个词典释... 古文自动翻译技术可有效促进古籍的传承和发展,弘扬中华传统文化。然而,现有古籍翻译语料规模较小,知识缺乏,导致古文翻译系统性能不佳。该文提出使用词典注释资源增强古文翻译系统。作者收集古汉语常见汉字的释义,并设计了一个词典释义选择-融合的二阶段机器翻译框架,以从词典释义中获取有效信息,去除无效信息。在一个中等规模的古文翻译数据集上的实验表明,该文的方法相比于基线模型和前人的释义融合方法,显著提升了翻译质量。另外,该文还设计了一个具有古文特色的翻译人工评估体系,并对现有的古文翻译系统进行了综合、全面的评估。 展开更多
关键词 古汉语 机器翻译 词典释义
在线阅读 下载PDF
基于Transformer神经机器翻译的文本隐写方法
7
作者 金家立 马卫娇 +1 位作者 李晖 金纾羽 《计算机应用与软件》 北大核心 2025年第5期381-386,共6页
针对基于机器翻译的文本隐写方法存在的翻译质量差、隐藏容量低的问题,提出一种基于Transformer神经机器翻译的文本隐写方法。通过使用较为先进的神经机器翻译模型以及加入隐藏模块的Beam Search解码器,能够根据秘密信息在每一时间步输... 针对基于机器翻译的文本隐写方法存在的翻译质量差、隐藏容量低的问题,提出一种基于Transformer神经机器翻译的文本隐写方法。通过使用较为先进的神经机器翻译模型以及加入隐藏模块的Beam Search解码器,能够根据秘密信息在每一时间步输出与之对应的BPE编码,实现在翻译的过程中嵌入秘密信息。实验结果表明,该方法能够生成高质量、大隐藏容量的隐写译文。与以往的方法相比,BLEU值和隐藏容量分别提升4.84和1.63百分点。 展开更多
关键词 信息隐藏 文本隐写 机器翻译 TRANSFORMER
在线阅读 下载PDF
大模型微调的多领域机器翻译方法综述 被引量:1
8
作者 陈子建 王斯日古楞 斯琴图 《计算机科学与探索》 北大核心 2025年第4期916-928,共13页
随着机器翻译技术的快速发展,基于预训练大模型的机器翻译方法已在自然语言处理领域占据重要地位。然而,由于不同领域之间语言特征、词汇风格和表达方式的显著差异,单一预训练模型在多领域翻译任务中难以实现高效且稳定的性能。为此,聚... 随着机器翻译技术的快速发展,基于预训练大模型的机器翻译方法已在自然语言处理领域占据重要地位。然而,由于不同领域之间语言特征、词汇风格和表达方式的显著差异,单一预训练模型在多领域翻译任务中难以实现高效且稳定的性能。为此,聚焦于多领域机器翻译任务中大模型微调技术的关键问题,系统性地综述了微调技术的核心原理、主要方法及应用效果,重点分析了全参数微调、参数高效微调和提示微调三类策略的性能表现与适用场景。深入探讨了不同微调方法的优势与局限性,重点分析了在资源受限条件下如何通过高效微调策略平衡领域泛化能力与任务特异性,展示了参数高效微调与提示微调在资源利用效率和领域适应性方面的显著优势。通过对比分析与实验验证,进一步评估了不同微调策略在领域迁移和资源利用方面的实际效果,并通过案例分析验证了其有效性。未来的研究方向应重点关注资源的高效利用、模型的领域自适应能力,以及翻译质量和鲁棒性的提升,从而推动多领域机器翻译系统在性能与适应性方面的持续发展。 展开更多
关键词 大模型微调 多领域机器翻译 全参数微调 参数高效微调 提示微调
在线阅读 下载PDF
基于修辞结构的篇章级神经机器翻译
9
作者 姜云卓 贡正仙 《计算机工程与科学》 北大核心 2025年第1期180-190,共11页
虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提... 虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提出了对篇章单元和修辞结构树特征分别进行编码的方法。实验结果表明,所提方法加强了编码器对篇章结构和修辞上的表征能力,使用该方法对模型进行改进后,其翻译结果在多个数据集上都获得了明显提升,性能超过了多个优质的基线模型,并且在提出的定量评估方法和人工分析中译文质量上也表现出了明显改善。 展开更多
关键词 神经机器翻译 篇章分析 篇章翻译 修辞结构理论
在线阅读 下载PDF
基于孪生XLM-R模型的机器翻译双语平行语料过滤方法
10
作者 涂杰 李茂西 裘白莲 《中文信息学报》 北大核心 2025年第2期63-71,共9页
在机器翻译中,模型训练使用的双语平行语料的数量和质量极大地影响了系统的性能,然而当前很多双语平行语料是从双语可比语料中利用自动过滤方法提取的。为了提高双语平行语料自动过滤的性能,该文提出基于孪生XLM-R模型的双语平行语料过... 在机器翻译中,模型训练使用的双语平行语料的数量和质量极大地影响了系统的性能,然而当前很多双语平行语料是从双语可比语料中利用自动过滤方法提取的。为了提高双语平行语料自动过滤的性能,该文提出基于孪生XLM-R模型的双语平行语料过滤方法,使用基于跨语言预训练语言模型XLM-R的孪生神经网络将源语言句子与目标语言句子映射到深层语义空间,利用平均池化操作获得它们相同维度的句子表征,根据句子表征间余弦距离提取相似度高的平行句对。在WMT18双语平行语料过滤任务上的实验结果表明,该文所提模型优于对比的基线模型,与参与该评测的系统具有较好的可比性。 展开更多
关键词 机器翻译 双语平行语料自动过滤 孪生神经网络 XLM-R模型 对比损失
在线阅读 下载PDF
基于参数分配的多语言神经机器翻译连续学习研究
11
作者 谷舒豪 冯洋 《中文信息学报》 北大核心 2025年第4期77-84,共8页
多语言神经机器翻译的连续学习旨在让模型能够不断支持新的翻译方向,且保证原有翻译方向的性能不发生大幅下降。然而,现有的连续学习方法往往对新支持的翻译方向存在着若干限制或者模型参数爆炸等问题。为了解决这些问题,该文提出了一... 多语言神经机器翻译的连续学习旨在让模型能够不断支持新的翻译方向,且保证原有翻译方向的性能不发生大幅下降。然而,现有的连续学习方法往往对新支持的翻译方向存在着若干限制或者模型参数爆炸等问题。为了解决这些问题,该文提出了一种基于参数对翻译模型重要性的“分而治之”方法。该文提出的方法首先对预训练翻译模型的不同参数关于当前翻译性能的重要性进行评估,然后将对当前翻译性能影响大的参数在原有翻译方向和新的翻译方向之间进行共享,对当前翻译性能影响较小的参数则单独分配给新的翻译方向,用于学习新语言的知识。该文在不同的语言对上进行了实验,并与其他系统进行了对比,结果表明,该方法对模型性能有显著提升。 展开更多
关键词 多语言机器翻译 连续学习 参数分配
在线阅读 下载PDF
利用词链提高文档级神经机器翻译的词汇翻译一致性
12
作者 雷翔宇 李军辉 《中文信息学报》 北大核心 2025年第2期72-79,共8页
近年来,各种上下文感知模块的引入,使得文档级神经机器翻译(Document-level Neural Machine Translation,DNMT)取得了令人瞩目的进步。受“一个语篇一个翻译(one translation per discourse)”的启发,该文在代表性DNMT模型G-Transforme... 近年来,各种上下文感知模块的引入,使得文档级神经机器翻译(Document-level Neural Machine Translation,DNMT)取得了令人瞩目的进步。受“一个语篇一个翻译(one translation per discourse)”的启发,该文在代表性DNMT模型G-Transformer的基础上,提出一种有效的方法对源端文档中重复出现的词汇进行建模以缓解词汇翻译不一致问题。具体来说,首先获取源端文档中每个单词的词链;然后,使用词链注意力机制以交换同一词链单词之间的上下文信息,从而增强词汇翻译一致性。基于汉?英和德?英文档级翻译任务的实验结果表明,该文的办法不仅显著缓解了词汇翻译不一致的问题,而且提高了翻译性能。 展开更多
关键词 文档级神经机器翻译 词汇翻译一致性 词链
在线阅读 下载PDF
融合术语和依存位置编码的英中专利复杂长句机器翻译
13
作者 李永辉 叶娜 +1 位作者 白宇 张桂平 《计算机科学》 北大核心 2025年第S1期262-270,共9页
现有的神经机器翻译方法在处理专利文本中的复杂长句时仍然面临挑战。首先对专利文本中的复杂长句进行了定量化定义,并针对其翻译过程中存在的术语漏译、错译以及句子结构错译的问题提出了融入术语信息和依存位置编码的神经机器翻译模... 现有的神经机器翻译方法在处理专利文本中的复杂长句时仍然面临挑战。首先对专利文本中的复杂长句进行了定量化定义,并针对其翻译过程中存在的术语漏译、错译以及句子结构错译的问题提出了融入术语信息和依存位置编码的神经机器翻译模型。该模型将被约束的术语向量化集成到编码器和解码器的注意力模块以及输出层中,并在位置编码处融合依存位置编码缓解长距离依赖问题。实验表明,所提模型相对于其他几个基线模型在术语翻译成功率和复杂长句整体翻译性能上均有显著提升。 展开更多
关键词 神经机器翻译 复杂长句 术语 专利文本 依存位置编码
在线阅读 下载PDF
神经机器翻译中课程学习研究综述
14
作者 胡春月 斯琴图 王斯日古楞 《计算机科学与探索》 北大核心 2025年第2期334-343,共10页
课程学习作为一种新兴技术,近年来逐渐受到关注,它符合人类的学习习惯,由简到难、由浅至深。其核心思想是让模型从简单的、基础的概念开始学习,逐渐过渡到更复杂、更高层次的内容。在神经机器翻译中,课程学习作为一种训练策略,旨在帮助... 课程学习作为一种新兴技术,近年来逐渐受到关注,它符合人类的学习习惯,由简到难、由浅至深。其核心思想是让模型从简单的、基础的概念开始学习,逐渐过渡到更复杂、更高层次的内容。在神经机器翻译中,课程学习作为一种训练策略,旨在帮助模型按照一定规律学习。课程学习现已被证明可以加速模型收敛,提高模型翻译质量和稳定性。从机器学习的角度介绍了课程学习的定义及其基础框架,并进一步探讨了课程学习在神经机器翻译领域中的应用。从样本难度评估与模型训练调度策略两个方面,详细阐述了预定义课程学习和动态课程学习两种方法。预定义课程学习通过事先确定样本的难度顺序,引导模型从简单到复杂的任务逐步学习;而动态课程学习则依据模型当前的学习状态动态调整样本的难度,提供了更灵活的训练方式。分析了课程学习在神经机器翻译领域的未来研究趋势,并提出了三个值得进一步探索的研究方向。 展开更多
关键词 课程学习 神经机器翻译 难度评估 训练调度
在线阅读 下载PDF
第二十一届全国机器翻译与多语言信息处理大会(CCMT 2025)征文通知
15
作者 《中文信息学报》 北大核心 2025年第6期178-178,共1页
第二十一届全国机器翻译与多语言信息处理大会(The 21st China Conference on Machine Translation and Multilingual Technology,CCMT2025)将于2025年9月26日至28日在甘肃兰州举行。本届会议由中国中文信息学会主办,西北民族大学承办。... 第二十一届全国机器翻译与多语言信息处理大会(The 21st China Conference on Machine Translation and Multilingual Technology,CCMT2025)将于2025年9月26日至28日在甘肃兰州举行。本届会议由中国中文信息学会主办,西北民族大学承办。CCMT旨在为国内外机器翻译界同行提供一个交互平台,加强国内外同行的学术交流,召集各路专家学者针对机器翻译的理论方法、应用技术和评测活动等若干关键问题进行深入的研讨,为促进中国机器翻译事业的发展,起到积极的推动作用。 展开更多
关键词 学术交流 机器翻译 CCMT2025 多语言信息处理
在线阅读 下载PDF
从规则到生成:机器翻译技术的演进、现状及未来发展趋势
16
作者 刘松 《山东外语教学》 北大核心 2025年第3期122-132,共11页
随着人工智能和深度学习技术的迅猛发展,机器翻译在促进跨语言交流中扮演着越来越重要的角色。本文系统回顾了机器翻译技术从早期基于规则的系统,到基于大规模数据的统计方法,再到基于深度学习的神经机器翻译,直到当前生成式人工智能翻... 随着人工智能和深度学习技术的迅猛发展,机器翻译在促进跨语言交流中扮演着越来越重要的角色。本文系统回顾了机器翻译技术从早期基于规则的系统,到基于大规模数据的统计方法,再到基于深度学习的神经机器翻译,直到当前生成式人工智能翻译模型四个阶段的演进;同时详细论述了,尽管生成式人工智能翻译模型在翻译质量和效率方面取得了显著进步,但仍面临数据稀缺、模型泛化能力有限、评估机制滞后、可解释性不足、伦理及文化敏感度欠缺等多方面问题。文章提出,未来机器翻译技术发展应聚焦于提高模型的泛化能力和可解释性,开发更全面的评估工具,确保翻译系统的文化适应性和伦理合规性,以使这一技术得以在更广泛的应用场景中释放潜力。 展开更多
关键词 翻译技术 机器翻译 生成式人工智能
在线阅读 下载PDF
一种基于迁移学习的藏英神经机器翻译方法
17
作者 扎西平措 张佳亮 +1 位作者 群诺 尼玛扎西 《高原科学研究》 2025年第2期105-112,共8页
随着全球化背景下跨文化交流需求的日益增长,藏英翻译在促进我国藏族文化的传播、加强与外界的联系以及提升藏语言数字化应用等方面具有重要的现实意义。然而,藏英平行语料资源的严重匮乏,极大地制约了藏英神经机器翻译研究进展,导致系... 随着全球化背景下跨文化交流需求的日益增长,藏英翻译在促进我国藏族文化的传播、加强与外界的联系以及提升藏语言数字化应用等方面具有重要的现实意义。然而,藏英平行语料资源的严重匮乏,极大地制约了藏英神经机器翻译研究进展,导致系统在处理低频词汇和复杂句式时表现欠佳。针对这一问题,文章系统探讨了迁移学习技术在藏英神经机器翻译中的应用潜力。通过分析父模型的数据规模、目标语言特性以及参数冻结等因素对藏英翻译模型性能的影响基础上,借助其他语言的丰富语料和预训练模型,探索迁移学习策略在藏英神经机器翻译中的潜在优势。研究结果显示,引入迁移学习策略后藏英神经机器翻译性能得到了很大的提升,相比于传统策略BLEU值提高了1.88个点。该方法不仅能够有效缓解藏英语句对的不足,还能有效增强藏英神经机器翻译模型的翻译质量和泛化能力。 展开更多
关键词 藏英机器翻译 生成式对抗网络(GAN) 迁移学习
在线阅读 下载PDF
维吾尔语机器翻译研究综述 被引量:2
18
作者 哈里旦木·阿布都克里木 侯钰涛 +2 位作者 姚登峰 阿布都克力木·阿布力孜 陈吉尚 《计算机工程》 CSCD 北大核心 2024年第1期1-16,共16页
维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语... 维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语机器翻译发展的不同阶段,研究人员针对其特点在算法和模型上不断优化与创新,取得了一定的研究成果,但缺乏系统性的综述。全面回顾维吾尔语机器翻译的相关研究,并根据方法的不同将其分为基于规则和实例的维吾尔语机器翻译、基于统计的维吾尔语机器翻译以及基于神经网络的维吾尔语机器翻译3种类型,同时对相关学术活动和语料库资源进行汇总。为进一步探索维吾尔语机器翻译的潜力,采用ChatGPT模型对维吾尔语-汉语机器翻译任务进行初步研究,实验结果表明,在Few-shot情景下,随着示例数的增加,翻译性能先升后降,在10-shot时表现最佳。此外,思维链方法在维吾尔语机器翻译任务中并未展示出更优的翻译能力。最后对维吾尔语机器翻译未来的研究方向进行了展望。 展开更多
关键词 维吾尔语 基于规则和实例的机器翻译 统计机器翻译 神经机器翻译 大语言模型
在线阅读 下载PDF
神经机器翻译综述 被引量:8
19
作者 章钧津 田永红 +1 位作者 宋哲煜 郝宇峰 《计算机工程与应用》 CSCD 北大核心 2024年第4期57-74,共18页
机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器... 机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器翻译、基于统计的机器翻译和基于深度学习的机器翻译三种方法进行对比总结;然后引出神经机器翻译,并对其常见的类型进行讲解;接着选取多模态机器翻译、非自回归机器翻译、篇章级机器翻译、多语言机器翻译、数据增强技术和预训练模型六个主要的神经机器翻译研究领域进行重点介绍;最后从低资源语言、上下文相关翻译、未登录词和大模型四个方面对神经机器翻译的未来进行了展望。通过系统性的介绍以更好地理解神经机器翻译的发展现状。 展开更多
关键词 机器翻译 神经机器翻译 篇章级机器翻译 数据增强 预处理技术
在线阅读 下载PDF
多策略机器翻译研究综述 被引量:21
20
作者 李业刚 黄河燕 +2 位作者 史树敏 冯冲 苏超 《中文信息学报》 CSCD 北大核心 2015年第2期1-9,23,共10页
该文全面综述和分析了多策略机器翻译的研究。根据所采用策略方式的差异,我们将多策略机器翻译分为系统级策略融合和模块级策略融合。在分别介绍了不同的翻译方法后,着重介绍了系统级策略融合和模块级策略融合各自具有代表性的研究工作... 该文全面综述和分析了多策略机器翻译的研究。根据所采用策略方式的差异,我们将多策略机器翻译分为系统级策略融合和模块级策略融合。在分别介绍了不同的翻译方法后,着重介绍了系统级策略融合和模块级策略融合各自具有代表性的研究工作。最后,对多策略机器翻译的研究进行了展望。 展开更多
关键词 机器翻译 多策略机器翻译 融合机器翻译 混合机器翻译 多引擎机器翻译
在线阅读 下载PDF
上一页 1 2 48 下一页 到第
使用帮助 返回顶部