-
题名基于现代智能识别技术的英语机器翻译模型
被引量:4
- 1
-
-
作者
张帆
-
机构
中国民航飞行学院空中乘务学院
-
出处
《现代电子技术》
北大核心
2018年第16期151-154,共4页
-
基金
四川省教育厅自筹科研项目(15ZB0276)~~
-
文摘
基于句法分析的英语机器翻译方法无法解决智能识别技术中海量英语语言的部分结构歧义导致机器翻译准确度低的问题。因此,在分析智能机器翻译工具辅助英语翻译应用的基础上,设计与实现基于现代智能识别技术的英语机器翻译模型。依据英文句子产生中文句子和对齐过程,基于英文句子获取中文句子长度、首个中文词串的链接位置,获取总体中文句子以及机器翻译对在句子中的次数。采用基于最大熵的统计机器翻译方法,通过直接最大熵模型训练得到相关参数,获取不同英语语言特征间的最佳组合方式,解决海量英语语言中的部分结构歧义问题,提高英语机器翻译的准确度。实验结果表明,所设计的英语机器翻译模型,具有较高的翻译准确度和稳定性。
-
关键词
智能识别技术
英语翻译
机器翻译模型
结构歧义
最大熵
翻译准确度
-
Keywords
intelligent recognition technology
English translation
machine translation model
structural ambiguity
maximum entropy
translation accuracy
-
分类号
TN915-34
[电子电信—通信与信息系统]
H319.3
[语言文字—英语]
-
-
题名面向小语种机器翻译的平行语料库构建方法
被引量:7
- 2
-
-
作者
刘妍
熊德意
-
机构
天津大学智能与计算学部
-
出处
《计算机科学》
CSCD
北大核心
2022年第1期41-46,共6页
-
基金
国家重点研发计划(2019QY1802)。
-
文摘
神经机器翻译模型的训练效果在很大程度上取决于平行语料库的规模和质量。除了一些常见语言外,汉语与小语种间高质量平行语料库的建设一直处于滞后状态。现有小语种平行语料库多采用自动句子对齐技术利用网络资源构建而成,在文本质量和领域等方面有诸多局限性。采用人工翻译的方式可以构建高质量平行语料库,但是缺乏相关经验和方法。文中从机器翻译实践者和研究者角度出发,介绍了经济高效的人工构建小语种平行语料库的工作,包括其总体目标、实施过程、流程细节和最后结果。在构建过程中尝试并积累了各种经验,形成了小语种到汉语平行语料库构建方法、建议的总结。最终,成功构建了波斯语到汉语、印地语到汉语、印度尼西亚语到汉语各50万条高质量平行语料。实验结果表明,所构建的平行语料库有较好的质量,提高了小语种神经机器翻译模型的训练效果。
-
关键词
平行语料库
小语种
神经机器翻译模型
-
Keywords
Parallel corpus
Minority language
Neural machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一个基于JAVA的堆栈式自然语言翻译解码器
被引量:1
- 3
-
-
作者
聂进
-
机构
林雪平大学
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第4期105-108,共4页
-
文摘
解码是统计学自然语言翻译系统的重要一步,解码器的任务是用从训练文本中学习到的语言/翻译模型的信息来确定源句子最可能的翻译句子,解码器的输入是翻译模型和语言模型,以及源语言句子,输出源语言句子最可能的对应目标句子/翻译。由于可能的目标句子很多,通常解码算法只能搜索一小部分可能的目标语言句子。该文介绍了一种基于堆栈算法的,用Java实现的解码器。Java平台提供了方便的跨平台的应用,高度安全、开放、健壮。解码器的实现重点在于解码算法和参数的选择。
-
关键词
解码
解码器
基于统计模型的机器翻译
堆栈搜索
JAVA
-
Keywords
decoding,decoder,Statistical Machine Translation(SMT),stack search,Java
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-