-
题名基于长短时注意力机制的汉藏党政公文机器翻译
被引量:1
- 1
-
-
作者
赞拉公
安见才让
-
机构
青海民族大学智能科学与工程学院
青海民族大学藏文信息处理与软件研究所
-
出处
《信息技术与信息化》
2025年第1期91-94,共4页
-
基金
青海民族大学2023年度校级本硕博(学生)项目“基于深度学习的汉藏政府公文机器翻译技术研究”(09M2023005)。
-
文摘
在研究汉藏党政公文机器翻译时,由于语言资源匮乏,在对党政公文领域的术语、短语及句子进行翻译时,专用术语和短句方面均暴露出错译、漏译、解释性翻译、口语化翻译以及用词不精准等问题。这些问题严重影响翻译质量,对汉藏党政公文的准确传递和理解起着负面作用。因此,构建高质量的汉藏党政公文语料库的同时融合和优化模型性能来提高翻译任务至关重要,文章通过融合LSTM和Transformer的长短时注意力机制的翻译模型来分别在音节、词、音节和词融合的分词方式上进行实验,实验结果表明,融合LSTM和Transformer的长短时注意力机制的翻译模型在音词融合分词方式上准确率分别在词和音节上提升了3.14%和1.92%,此外,将翻译软件与阳光翻译、班智达翻译软件在翻译任务上进行对比后得知,翻译软件在汉藏党政公文领域的翻译效果达到了预期的目标。
-
关键词
长短时注意力机制
模型融合
汉藏党政公文
音词融合
翻译效果
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
H085
[语言文字—语言学]
H214
[语言文字—少数民族语言]
-
-
题名基于实例的党政公文汉藏机器翻译
- 2
-
-
作者
赞拉公
安见才让
-
机构
青海民族大学智能科学与工程学院
青海民族大学藏文信息处理与软件研究所
-
出处
《信息化研究》
2024年第6期73-78,共6页
-
基金
青海民族大学2023年度校级本硕博(学生)项目阶段性成果(No.09M2023005)。
-
文摘
现有的汉藏机器翻译,在翻译党政公文领域的术语和短语时,专用术语、短句方面存在着错译、漏译、解释性翻译、口语化翻译、用词不精准等问题。本文针对以上问题提出了以实例库为基础的Jaccard算法和GRU模型融合的汉藏实例机器翻译方法,以中国民族语文翻译局藏语文实例库为基础,通过计算句子相似度和文本语义匹配,计算出相似度的阈值为0.7时输出待翻译句子对应的藏文译文,有效解决了党政公文的专用术语和标志性政治短语的错译问题,从而使得译文的规范性和统一性得到了保障。
-
关键词
实例机器翻译
相似度
党政公文
汉藏机器翻译
-
Keywords
example machine translation
similarity
party and government documents
Chinese Tibetan machine translation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-