期刊文献+
共找到191篇文章
< 1 2 10 >
每页显示 20 50 100
融入实体翻译的汉越神经机器翻译模型
1
作者 高盛祥 侯哲 +1 位作者 余正涛 赖华 《计算机应用》 北大核心 2025年第1期69-74,共6页
在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源... 在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R(Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。 展开更多
关键词 汉越神经机器翻译 实体翻译 双语词典 指针网络 低资源
在线阅读 下载PDF
基于多语种文本符号的艺术图像生成模型
2
作者 唐宏 卓诗语 《无线电通信技术》 北大核心 2025年第3期486-492,共7页
文本生成图像(Text-to-Image,TTI)任务是指利用文本符号来生成图像,在艺术设计领域中有重要应用前景。由于缺乏不同语种的注释图像数据,对TTI的研究主要集中在英文领域,现有TTI模型无法利用其他语种数据进行图像生成。基于上述考虑,研... 文本生成图像(Text-to-Image,TTI)任务是指利用文本符号来生成图像,在艺术设计领域中有重要应用前景。由于缺乏不同语种的注释图像数据,对TTI的研究主要集中在英文领域,现有TTI模型无法利用其他语种数据进行图像生成。基于上述考虑,研究多语种TTI(Multilingual TTI,MTTI)以及基于神经机器翻译引导的MTTI系统,依托多语种多模态编码器,提出基于多语种文本符号的艺术图像生成模型(Art Image Generation Model Based on Multilingual Text Symbols,AIG-MTS),学习权重并整合多语种文本知识,减少语种之间的差异,提高模型性能。在标准数据集COCO-CN、Multi30K Task2和LAION-5B上进行实验,相比于主流算法,AIG-MTS模型在所有数据集上的性能最佳。 展开更多
关键词 设计领域 多语种 文本生成图像 多模态编码器 神经机器翻译
在线阅读 下载PDF
基于标签句子重构的多语言零样本神经机器翻译
3
作者 陈潇 杨雅婷 +3 位作者 董瑞 时现伟 马博 吐尔洪·吾司曼 《中文信息学报》 北大核心 2025年第2期80-88,共9页
针对当前多语言零样本翻译的标签策略难以提供丰富的翻译方向信息和模型对语言建模能力的不足,进而导致翻译脱靶的问题,该文提出了使用标签句子重构的多语言零样本神经机器翻译方法。具体而言,首先提出了一种词级别的标签策略,在编码器... 针对当前多语言零样本翻译的标签策略难以提供丰富的翻译方向信息和模型对语言建模能力的不足,进而导致翻译脱靶的问题,该文提出了使用标签句子重构的多语言零样本神经机器翻译方法。具体而言,首先提出了一种词级别的标签策略,在编码器端增加目标语言标签嵌入,在源语言句子每个词的嵌入表示中注入目标语言信息;其次设计了标签句子重构任务,对句子添加噪声和使用词级别的标签策略后进行重构操作,以达到增强模型语言建模能力的目的。在MultiUN数据集和Europarl数据集上的零样本实验结果表明,所提方法在零样本翻译上的平均BLEU值分别超过强基线0.7和0.3。消融实验结果表明,所提出的语言标签嵌入策略和标签句子重构均能有效提升模型的零样本翻译性能。 展开更多
关键词 零样本机器翻译 多语言神经机器翻译 自然语言处理
在线阅读 下载PDF
面向航空手册的偏向性检索增强集成翻译模型
4
作者 杨晨 叶娜 张桂平 《计算机科学》 北大核心 2025年第S2期100-109,共10页
航空手册是指与大型民用飞机设计相关的出版物,包括飞行、维护、安全等手册。作为一种对语言表达的清晰度和精准度有极高要求的技术文档,航空手册的翻译要求译文符合简化技术英语规范(The Simplified Technical English Specification,S... 航空手册是指与大型民用飞机设计相关的出版物,包括飞行、维护、安全等手册。作为一种对语言表达的清晰度和精准度有极高要求的技术文档,航空手册的翻译要求译文符合简化技术英语规范(The Simplified Technical English Specification,STE)。简化技术英语是一种受控自然语言,对文档的语法和词汇使用提出了明确而严格的规则限制。为此,提出了一种STE引导的偏向性检索增强集成翻译模型(Biased Retrieval-augmented Ensembling Translation Model,BRAETM),模型内利用跨语言检索同类型且长度规范的偏向性目标语言序列指导解码端译文生成,同时采用STE Dictionary引导的规范词偏向性解码策略修正译文用词;模型外依据预估模块结果选择性集成非被动翻译模型,以此生成句式、语态、用词等方面更规范的译文。实验结果表明,提出的模型能够生成更符合简化技术英语规则的译文,相比先进的基线模型,在两个航空手册测试语料上的BLEU值分别提升了3.60和2.67。 展开更多
关键词 神经机器翻译 简化技术英语 偏向性翻译记忆 STE Dictionary
在线阅读 下载PDF
文档级神经机器翻译综述
5
作者 吕星林 李军辉 +2 位作者 陶仕敏 杨浩 张民 《软件学报》 北大核心 2025年第1期152-183,共32页
机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到... 机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到端的神经机器翻译(neural machine translation,NMT)方法显著超越了统计机器翻译(statistical machine translation,SMT)方法,成为目前机器翻译研究的主流方法.然而,神经机器翻译系统通常以句子为翻译单位,在面向文档的翻译场景中,将文档中每个句子独立地进行翻译,会因脱离文档的篇章语境引起一些篇章级的错误,如词语错翻、句子间不连贯等.因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法,文档级的神经机器翻译(document-level neural machine translation,DNMT)的目标正是如此,成为机器翻译研究的热门方向.调研了近年来在文档级神经机器翻译研究方向的主要工作,从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述,目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向.同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战,希望能带给研究者们一些启发. 展开更多
关键词 神经机器翻译 Transformer模型 文档上下文 篇章评测
在线阅读 下载PDF
基于多视角注意力的篇章神经机器翻译
6
作者 贾爱鑫 李军辉 《中文信息学报》 北大核心 2025年第9期43-52,共10页
序列到序列模型Transformer在句子级神经机器翻译任务上已取得了瞩目的效果。但直接将Transformer应用于长文本(如篇章)的翻译,却很难达到较好的效果。该文首先分析了Transformer模型在长文本(篇章)上翻译性能欠佳的主要原因,然后合理... 序列到序列模型Transformer在句子级神经机器翻译任务上已取得了瞩目的效果。但直接将Transformer应用于长文本(如篇章)的翻译,却很难达到较好的效果。该文首先分析了Transformer模型在长文本(篇章)上翻译性能欠佳的主要原因,然后合理地提出了多视角注意力机制。具体地,该文改进传统的多头注意力机制,使得多头注意力机制可以主动地关注序列内的不同内容,让一部分注意力头关注当前句,另一部分注意力头关注上下文等。在中英和英德篇章数据集上的实验结果表明,该文方法简单有效,在不增加任何参数的情况下,能够有效提升篇章神经机器翻译性能。 展开更多
关键词 神经机器翻译 篇章神经机器翻译 长序列翻译 多视角注意力机制
在线阅读 下载PDF
融合领域双语词典的泰-汉法律领域神经机器翻译方法
7
作者 李畅 高盛祥 余正涛 《厦门大学学报(自然科学版)》 北大核心 2025年第4期597-605,共9页
[目的]对于泰-汉法律领域神经机器翻译,由于训练所需平行语料稀缺,缺乏双语词级别的有效语义监督,难以做到一些实体词以及领域术语等领域关键词的精准翻译.针对该问题,本文提出一种融合领域双语词典的神经机器翻译方法.[方法]首先利用... [目的]对于泰-汉法律领域神经机器翻译,由于训练所需平行语料稀缺,缺乏双语词级别的有效语义监督,难以做到一些实体词以及领域术语等领域关键词的精准翻译.针对该问题,本文提出一种融合领域双语词典的神经机器翻译方法.[方法]首先利用法律领域语料库挖掘领域双语词典;然后使用基于不频繁法律领域中文词覆盖的方法筛选额外伪法律领域训练数据;在模型输入端,利用源句匹配的领域双语词典目标词构建额外提示数据;在模型结构中,引入提示浅编码器对提示进行表征,在源句编码器层中加入新的交叉注意力模块强化源句的表征,将源句表征与提示表征拼接作为最终编码器表征,在解码器端对编码器表征的交叉注意力作用下指导产生目标词序列.[结果]基于本文筛选方法混合训练的Transformer模型相比于仅用领域数据训练的模型,BLEU值提高了0.54个百分点;采用该混合训练集,融入提示信息的模型相比Transformer模型BLEU值又提升了0.90个百分点,并且相比于经典“语码转换”方法训练的模型BLEU值提升了0.61个百分点.[结论]本文数据筛选方法可在解决领域专业术语稀疏问题的同时降低通用高频词对翻译结果的干扰,提升领域翻译基线模型的性能;引入提示信息的模型能够有效地与提示进行交互,实现翻译性能的提升,并使领域关键词翻译更准确. 展开更多
关键词 法律领域 泰-汉神经机器翻译 领域双语词典 数据筛选 提示浅编码器 交叉注意力
在线阅读 下载PDF
基于修辞结构的篇章级神经机器翻译
8
作者 姜云卓 贡正仙 《计算机工程与科学》 北大核心 2025年第1期180-190,共11页
虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提... 虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提出了对篇章单元和修辞结构树特征分别进行编码的方法。实验结果表明,所提方法加强了编码器对篇章结构和修辞上的表征能力,使用该方法对模型进行改进后,其翻译结果在多个数据集上都获得了明显提升,性能超过了多个优质的基线模型,并且在提出的定量评估方法和人工分析中译文质量上也表现出了明显改善。 展开更多
关键词 神经机器翻译 篇章分析 篇章翻译 修辞结构理论
在线阅读 下载PDF
利用词链提高文档级神经机器翻译的词汇翻译一致性
9
作者 雷翔宇 李军辉 《中文信息学报》 北大核心 2025年第2期72-79,共8页
近年来,各种上下文感知模块的引入,使得文档级神经机器翻译(Document-level Neural Machine Translation,DNMT)取得了令人瞩目的进步。受“一个语篇一个翻译(one translation per discourse)”的启发,该文在代表性DNMT模型G-Transforme... 近年来,各种上下文感知模块的引入,使得文档级神经机器翻译(Document-level Neural Machine Translation,DNMT)取得了令人瞩目的进步。受“一个语篇一个翻译(one translation per discourse)”的启发,该文在代表性DNMT模型G-Transformer的基础上,提出一种有效的方法对源端文档中重复出现的词汇进行建模以缓解词汇翻译不一致问题。具体来说,首先获取源端文档中每个单词的词链;然后,使用词链注意力机制以交换同一词链单词之间的上下文信息,从而增强词汇翻译一致性。基于汉?英和德?英文档级翻译任务的实验结果表明,该文的办法不仅显著缓解了词汇翻译不一致的问题,而且提高了翻译性能。 展开更多
关键词 文档级神经机器翻译 词汇翻译一致性 词链
在线阅读 下载PDF
基于对比学习的转录文本翻译方法研究
10
作者 王世宁 刘宇宸 宗成庆 《中文信息学报》 北大核心 2025年第4期67-76,共10页
神经机器翻译系统极易受到输入噪声的干扰,特别是在口语翻译场景中,翻译系统的输入来自语音识别模块的输出,而后者不可避免地存在着识别错误,最终影响翻译性能。现有方法多采用错误修正和翻译的级联式策略以减少识别错误造成的影响,但... 神经机器翻译系统极易受到输入噪声的干扰,特别是在口语翻译场景中,翻译系统的输入来自语音识别模块的输出,而后者不可避免地存在着识别错误,最终影响翻译性能。现有方法多采用错误修正和翻译的级联式策略以减少识别错误造成的影响,但易导致系统时延增长,且可能引入额外的噪声。该文提出了一种基于对比学习的鲁棒神经机器翻译方法,将包含识别错误的样本作为正例,通过句子级别或词级别的对比损失,分别从整体和局部两种不同角度拉近含噪声文本与干净文本在表示空间中的距离,以降低识别错误对文本表示的影响。同时,该文设计了多种精细化的错误合成方法以模拟更加真实的语音识别错误。在英汉双向多个数据集上的实验表明,该文所提出的方法可以有效降低语音识别错误对翻译模型的影响,提高模型的鲁棒性和翻译性能。 展开更多
关键词 对比学习 鲁棒神经机器翻译 语音识别错误
在线阅读 下载PDF
基于多模态联合建模的端到端语音到文本翻译
11
作者 欧佳乐 昝红英 许鸿飞 《小型微型计算机系统》 北大核心 2025年第10期2338-2344,共7页
通过联合建模或多任务学习,可以利用大规模的语音识别和文本翻译数据来提升端到端语音到文本翻译的性能.然而,现有大多数方法通常需要对语音翻译模型进行架构调整,或者依赖多阶段的预训练和微调.此外,语音与文本之间的模态差异使得使用... 通过联合建模或多任务学习,可以利用大规模的语音识别和文本翻译数据来提升端到端语音到文本翻译的性能.然而,现有大多数方法通常需要对语音翻译模型进行架构调整,或者依赖多阶段的预训练和微调.此外,语音与文本之间的模态差异使得使用共享编码器同时处理二者变得具有挑战性.为了解决这些问题,本文提出了一个简单的多模态联合建模框架.该框架将语音翻译和文本翻译的联合建模视作多语言神经机器翻译建模,并在自注意层中引入模态感知的相对位置编码,使用模态感知的单一编码器来同时处理语音和文本编码,而无需复杂化模型架构.然后结合大规模语音识别数据,和提出的基于翻译损失方法筛选的文本翻译数据,进行多模态联合建模训练.在两个基准测试中的实验结果表明,与基线方法相比,使用单编码器方法对内部和外部的语音识别及文本翻译数据进行联合建模后,可以显著提高多个语音翻译任务上双向翻译(从英语和到英语)的性能. 展开更多
关键词 端到端语音到文本翻译 多模态联合建模 多语言神经机器翻译 相对位置编码
在线阅读 下载PDF
基于孪生XLM-R模型的机器翻译双语平行语料过滤方法
12
作者 涂杰 李茂西 裘白莲 《中文信息学报》 北大核心 2025年第2期63-71,共9页
在机器翻译中,模型训练使用的双语平行语料的数量和质量极大地影响了系统的性能,然而当前很多双语平行语料是从双语可比语料中利用自动过滤方法提取的。为了提高双语平行语料自动过滤的性能,该文提出基于孪生XLM-R模型的双语平行语料过... 在机器翻译中,模型训练使用的双语平行语料的数量和质量极大地影响了系统的性能,然而当前很多双语平行语料是从双语可比语料中利用自动过滤方法提取的。为了提高双语平行语料自动过滤的性能,该文提出基于孪生XLM-R模型的双语平行语料过滤方法,使用基于跨语言预训练语言模型XLM-R的孪生神经网络将源语言句子与目标语言句子映射到深层语义空间,利用平均池化操作获得它们相同维度的句子表征,根据句子表征间余弦距离提取相似度高的平行句对。在WMT18双语平行语料过滤任务上的实验结果表明,该文所提模型优于对比的基线模型,与参与该评测的系统具有较好的可比性。 展开更多
关键词 机器翻译 双语平行语料自动过滤 孪生神经网络 XLM-R模型 对比损失
在线阅读 下载PDF
面向开源视频的深度学习情报分析系统设计与实现
13
作者 鄢靖昀 姜君 曹秀云 《现代电子技术》 北大核心 2025年第12期167-178,共12页
针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运... 针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运行,并集成基于深度学习的自动语音识别、神经机器翻译、光学字符识别以及大模型文本摘要生成等前沿技术,提供端到端的解决方案,实现全面的视频分析功能。功能测试结果显示,所有模块均能按设计要求正常运行。性能测试结果表明,系统在处理大规模视频数据的实时环境中表现稳定、性能优异,高并发情况下响应时间在3 s以内,支持最多2万并发用户。所设计系统不仅能高效提取视频情报,还拥有直观的用户交互界面,可以提供多样化的情报分析应用服务,并满足大规模用户在视频分析场景下的业务需求。 展开更多
关键词 情报分析 开源视频 深度学习 自动语音识别 神经机器翻译 光学字符识别
在线阅读 下载PDF
基于神经网络的机器翻译研究综述
14
作者 马潇 田永红 赵伟 《计算机工程与应用》 北大核心 2025年第22期36-54,共19页
随着计算机技术的进步,机器翻译已成为实现跨语言沟通的关键工具,其发展历程可分为基于规则的机器翻译、基于统计的机器翻译以及基于深度学习的神经机器翻译。聚焦于大语言模型在翻译领域的应用与创新,全面回顾并系统性梳理了神经机器翻... 随着计算机技术的进步,机器翻译已成为实现跨语言沟通的关键工具,其发展历程可分为基于规则的机器翻译、基于统计的机器翻译以及基于深度学习的神经机器翻译。聚焦于大语言模型在翻译领域的应用与创新,全面回顾并系统性梳理了神经机器翻译(neural machine translation,NMT)的最新进展。从早期的循环神经网络到卷积神经网络,再到当前广泛应用的Transformer模型及其变体,概述了机器翻译的演进历程,分析了NMT的主流架构发展。深入剖析了大语言模型翻译的三个关键维度,系统比较了全参数微调与高效参数微调等技术在翻译任务上的差异性表现;详细探讨了多语言大模型翻译技术、零样本与少样本跨语言迁移的技术挑战与解决方案;全面综述了知识图谱增强、领域专业知识融合及多模态知识融合的大模型翻译方法;介绍了机器翻译的评价指标与常用数据集,并对低资源语言翻译提升、可解释与可控翻译系统、跨文化适应性翻译、计算资源优化以及隐私保护与安全可控等方向的研究前景进行了展望。 展开更多
关键词 神经机器翻译 大语言模型 参数微调 多语言机器翻译 低资源语言翻译 知识图谱增强
在线阅读 下载PDF
神经机器翻译中课程学习研究综述
15
作者 胡春月 斯琴图 王斯日古楞 《计算机科学与探索》 北大核心 2025年第2期334-343,共10页
课程学习作为一种新兴技术,近年来逐渐受到关注,它符合人类的学习习惯,由简到难、由浅至深。其核心思想是让模型从简单的、基础的概念开始学习,逐渐过渡到更复杂、更高层次的内容。在神经机器翻译中,课程学习作为一种训练策略,旨在帮助... 课程学习作为一种新兴技术,近年来逐渐受到关注,它符合人类的学习习惯,由简到难、由浅至深。其核心思想是让模型从简单的、基础的概念开始学习,逐渐过渡到更复杂、更高层次的内容。在神经机器翻译中,课程学习作为一种训练策略,旨在帮助模型按照一定规律学习。课程学习现已被证明可以加速模型收敛,提高模型翻译质量和稳定性。从机器学习的角度介绍了课程学习的定义及其基础框架,并进一步探讨了课程学习在神经机器翻译领域中的应用。从样本难度评估与模型训练调度策略两个方面,详细阐述了预定义课程学习和动态课程学习两种方法。预定义课程学习通过事先确定样本的难度顺序,引导模型从简单到复杂的任务逐步学习;而动态课程学习则依据模型当前的学习状态动态调整样本的难度,提供了更灵活的训练方式。分析了课程学习在神经机器翻译领域的未来研究趋势,并提出了三个值得进一步探索的研究方向。 展开更多
关键词 课程学习 神经机器翻译 难度评估 训练调度
在线阅读 下载PDF
基于深度学习的自然语言处理技术在智能翻译系统中的应用研究
16
作者 傅娟 《计算机科学》 北大核心 2025年第S2期86-91,共6页
随着全球化进程的加速,翻译需求日益增长,智能翻译系统的重要性愈发凸显。文中深入研究基于深度学习的自然语言处理技术在智能翻译系统中的应用。首先基于深度学习的智能翻译系统主要依托循环神经网络、长短期记忆网络和卷积神经网络等... 随着全球化进程的加速,翻译需求日益增长,智能翻译系统的重要性愈发凸显。文中深入研究基于深度学习的自然语言处理技术在智能翻译系统中的应用。首先基于深度学习的智能翻译系统主要依托循环神经网络、长短期记忆网络和卷积神经网络等架构,通过词向量表示和语义理解技术实现高质量翻译。在系统架构方面,编码器-解码器框架结合注意力机制显著提升了翻译质量,而基于Transformer的模型则在处理长距离依赖关系方面取得突破性进展。在实践应用中,谷歌神经机器翻译系统和CUBBITT等系统通过创新的数据增强技术和多语言模型训练方法,实现了接近人类水平的翻译效果。然而,当前智能翻译系统在处理语义歧义、适应语言多样性和跨文化理解等方面仍面临重大挑战。针对这些问题,提出了多源信息融合、跨语言预训练和知识增强等解决方案,并在准确度、流畅度等评价指标上取得显著进展。未来智能翻译系统的发展将朝着多模态融合、知识驱动和轻量化部署等方向发展,同时也需要进一步提升在低资源语言翻译和模型可解释性等方面的能力。 展开更多
关键词 深度学习 自然语言处理 神经网络机器翻译 智能翻译系统 技术挑战
在线阅读 下载PDF
零样本多语言神经机器翻译综述
17
作者 肖增 王斯日古楞 斯琴图 《计算机科学与探索》 北大核心 2025年第10期2635-2647,共13页
在多语言神经机器翻译中,零样本翻译是一个重要的研究方向,旨在使模型能够翻译训练过程中从未见过的语言对,实现跨语言迁移学习。然而,现有多语言模型在处理未见过语言对时,仍面临诸如语义偏移、翻译质量不稳定、语言方向不对称等问题,... 在多语言神经机器翻译中,零样本翻译是一个重要的研究方向,旨在使模型能够翻译训练过程中从未见过的语言对,实现跨语言迁移学习。然而,现有多语言模型在处理未见过语言对时,仍面临诸如语义偏移、翻译质量不稳定、语言方向不对称等问题,严重影响了翻译效果的可靠性与一致性。为系统性梳理该领域的研究现状,围绕“多语言模型构建方式对零样本翻译性能的影响”这一核心问题展开综述,旨在为后续研究者提供理论支持和方法借鉴。零样本翻译对于训练语料匮乏的语言对翻译任务意义重大,很大程度上降低了翻译成本。从语料资源的角度出发,介绍了零样本翻译的研究背景、基本定义、核心原理及其在跨文化沟通、新语言支持等场景中的实际应用价值。针对当前主流的零样本翻译建模方法,从基于预训练模型、双语监督训练和大语言模型构建多语言神经机器翻译的三个方向进行介绍。分析了多语言神经机器翻译中零样本翻译的未来研究趋势,为该领域进一步研究提供参考。 展开更多
关键词 零样本翻译 预训练模型 双语监督训练 大语言模型 多语言神经机器翻译
在线阅读 下载PDF
融合术语和依存位置编码的英中专利复杂长句机器翻译
18
作者 李永辉 叶娜 +1 位作者 白宇 张桂平 《计算机科学》 北大核心 2025年第S1期262-270,共9页
现有的神经机器翻译方法在处理专利文本中的复杂长句时仍然面临挑战。首先对专利文本中的复杂长句进行了定量化定义,并针对其翻译过程中存在的术语漏译、错译以及句子结构错译的问题提出了融入术语信息和依存位置编码的神经机器翻译模... 现有的神经机器翻译方法在处理专利文本中的复杂长句时仍然面临挑战。首先对专利文本中的复杂长句进行了定量化定义,并针对其翻译过程中存在的术语漏译、错译以及句子结构错译的问题提出了融入术语信息和依存位置编码的神经机器翻译模型。该模型将被约束的术语向量化集成到编码器和解码器的注意力模块以及输出层中,并在位置编码处融合依存位置编码缓解长距离依赖问题。实验表明,所提模型相对于其他几个基线模型在术语翻译成功率和复杂长句整体翻译性能上均有显著提升。 展开更多
关键词 神经机器翻译 复杂长句 术语 专利文本 依存位置编码
在线阅读 下载PDF
基于自注意力机制神经机器翻译的软件缺陷自动修复方法 被引量:6
19
作者 曹鹤玲 刘昱 韩栋 《电子学报》 EI CAS CSCD 北大核心 2024年第3期945-956,共12页
循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题... 循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题,提出一种基于自注意力神经机器翻译的软件缺陷自动修复方法(Self-attention Neural machine translation based automatic software Repair,SNRepair).首先,为有效缓解源码中的未登录词问题,对数据集引入子词切分技术进行预处理;其次,为解决源代码中棘手的长距离依赖问题并更充分地利用局部信息,构建融合局部建模的Transformer程序补丁生成模型;然后,采用缺陷自动定位技术定位缺陷语句位置,利用参数优化后的Transformer补丁生成模型生成候选补丁;最后,运行测试用例验证候选补丁.在具有395个真实Java软件缺陷的Defects4J缺陷库上实验评估,结果表明SNRepair方法与对比方法比较,修复成功率和修复效率更高. 展开更多
关键词 软件缺陷自动修复 神经机器翻译 自注意力机制 子词切分 局部建模
在线阅读 下载PDF
融合目标端上下文的篇章神经机器翻译 被引量:2
20
作者 贾爱鑫 李军辉 +1 位作者 贡正仙 张民 《中文信息学报》 CSCD 北大核心 2024年第4期59-68,共10页
神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神... 神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神经机器翻译。具体地,该文借助推敲网络的思想,对篇章源端进行二次翻译,第一次基于句子级翻译,第二次翻译参考了全篇的第一次翻译结果。基于LDC中英篇章数据集和WMT英德篇章数据集的实验结果表明,在引入较少的参数的条件下,该文方法能显著提高翻译性能。同时,随着第一次翻译(即句子级译文)质量的提升,所提方法也更有效。 展开更多
关键词 神经机器翻译 推敲网络 篇章翻译
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部