期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
汉藏机器翻译的特点与手写汉字切分分析研究
1
作者 杨宪泽 陈毅红 《计算机工程与科学》 CSCD 北大核心 2014年第8期1595-1598,共4页
汉藏机器翻译的研究是一项有益而复杂的课题。本文的工作主要有两项,一是分析了汉藏机器翻译中藏语句子特点,给出了一些汉藏翻译句型的举例;二是阐述了在汉藏机器翻译研究中一项前期的辅助工作,即设计了手写汉字切分方法和算法。
关键词 汉藏机器翻译 手写汉字切分 算法
在线阅读 下载PDF
基于统计的汉藏机器翻译系统关键技术研究与实现
2
作者 群诺 尼玛扎西 +1 位作者 完么扎西 嘎玛扎西 《高原科学研究》 2018年第2期97-104,共8页
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理... 随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理、动词及物性处理、格助词处理等;为解决平行语料不足导致的数据稀疏问题,对基于中介语言的词语翻译模型进行了改进,融合了基于中介语言的统计翻译模型和直接翻译模型;应用"少监督"的方法,改善了统计机器翻译模型训练过程的盲目性、低效性、冗余性和表面性等缺陷,并将这种方法加入到现有的训练过程得到改善的训练方法。 展开更多
关键词 汉藏机器翻译 调序算法 树到串翻译模型 自动分词与标注
在线阅读 下载PDF
基于改进字节对编码的汉藏机器翻译研究
3
作者 头旦才让 仁青东主 +2 位作者 尼玛扎西 于永斌 邓权芯 《电子科技大学学报》 EI CAS CSCD 北大核心 2021年第2期249-255,293,共8页
该文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型。通过测试和验证,模型的BLEU值达到36.8... 该文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型。通过测试和验证,模型的BLEU值达到36.84。该模型的命名实体翻译效果优于已商用汉藏在线翻译系统。同时,该文的神经机器翻译模型已部署于汉藏机器翻译网站,实现了汉藏神经机器翻译系统的应用推广。 展开更多
关键词 注意力机制 字节对编码 汉藏神经机器翻译 命名实体识别
在线阅读 下载PDF
面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究
4
作者 才让加 《中文信息学报》 CSCD 北大核心 2011年第6期157-161,共5页
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,需要对汉藏... 双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,需要对汉藏双语文本的篇章级、段落级、句子级自动对齐技术进行研究,为开发和研究汉藏机器翻译奠定基础。主要研究汉藏双语语料库对齐、汉藏双语词典抽取、双语语料的收集、整理、存储以及检索等关键技术。最终研究结果是藏文编码的自动识别与转换技术,藏语语料库构建技术、汉藏双语词典抽取技术、汉藏平行语料库句子和词语对齐技术,并建立面向汉藏机器翻译的大规模汉藏双语对齐语料库。 展开更多
关键词 汉藏机器翻译 汉藏双语语料库 编码 对齐技术
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部