期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
汉藏机器翻译的特点与手写汉字切分分析研究
1
作者
杨宪泽
陈毅红
《计算机工程与科学》
CSCD
北大核心
2014年第8期1595-1598,共4页
汉藏机器翻译的研究是一项有益而复杂的课题。本文的工作主要有两项,一是分析了汉藏机器翻译中藏语句子特点,给出了一些汉藏翻译句型的举例;二是阐述了在汉藏机器翻译研究中一项前期的辅助工作,即设计了手写汉字切分方法和算法。
关键词
汉藏机器翻译
手写汉字切分
算法
在线阅读
下载PDF
职称材料
基于统计的汉藏机器翻译系统关键技术研究与实现
2
作者
群诺
尼玛扎西
+1 位作者
完么扎西
嘎玛扎西
《高原科学研究》
2018年第2期97-104,共8页
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理...
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理、动词及物性处理、格助词处理等;为解决平行语料不足导致的数据稀疏问题,对基于中介语言的词语翻译模型进行了改进,融合了基于中介语言的统计翻译模型和直接翻译模型;应用"少监督"的方法,改善了统计机器翻译模型训练过程的盲目性、低效性、冗余性和表面性等缺陷,并将这种方法加入到现有的训练过程得到改善的训练方法。
展开更多
关键词
汉藏机器翻译
调序算法
树到串
翻译
模型
自动分词与标注
在线阅读
下载PDF
职称材料
基于改进字节对编码的汉藏机器翻译研究
3
作者
头旦才让
仁青东主
+2 位作者
尼玛扎西
于永斌
邓权芯
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2021年第2期249-255,293,共8页
该文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型。通过测试和验证,模型的BLEU值达到36.8...
该文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型。通过测试和验证,模型的BLEU值达到36.84。该模型的命名实体翻译效果优于已商用汉藏在线翻译系统。同时,该文的神经机器翻译模型已部署于汉藏机器翻译网站,实现了汉藏神经机器翻译系统的应用推广。
展开更多
关键词
注意力机制
字节对编码
汉藏
神经
机器翻译
命名实体识别
在线阅读
下载PDF
职称材料
面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究
4
作者
才让加
《中文信息学报》
CSCD
北大核心
2011年第6期157-161,共5页
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,需要对汉藏...
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,需要对汉藏双语文本的篇章级、段落级、句子级自动对齐技术进行研究,为开发和研究汉藏机器翻译奠定基础。主要研究汉藏双语语料库对齐、汉藏双语词典抽取、双语语料的收集、整理、存储以及检索等关键技术。最终研究结果是藏文编码的自动识别与转换技术,藏语语料库构建技术、汉藏双语词典抽取技术、汉藏平行语料库句子和词语对齐技术,并建立面向汉藏机器翻译的大规模汉藏双语对齐语料库。
展开更多
关键词
汉藏机器翻译
汉藏
双语语料库
编码
对齐技术
在线阅读
下载PDF
职称材料
题名
汉藏机器翻译的特点与手写汉字切分分析研究
1
作者
杨宪泽
陈毅红
机构
西南民族大学计算机科学与技术学院
出处
《计算机工程与科学》
CSCD
北大核心
2014年第8期1595-1598,共4页
基金
中央高校科研平台项目(11NPT02)
四川国际旅行公司合作项目(25724101)
文摘
汉藏机器翻译的研究是一项有益而复杂的课题。本文的工作主要有两项,一是分析了汉藏机器翻译中藏语句子特点,给出了一些汉藏翻译句型的举例;二是阐述了在汉藏机器翻译研究中一项前期的辅助工作,即设计了手写汉字切分方法和算法。
关键词
汉藏机器翻译
手写汉字切分
算法
Keywords
Chinese-Tibetan machine translation
handwritten Chinese segmentation
algorithm
分类号
TP391.2 [自动化与计算机技术]
在线阅读
下载PDF
职称材料
题名
基于统计的汉藏机器翻译系统关键技术研究与实现
2
作者
群诺
尼玛扎西
完么扎西
嘎玛扎西
机构
西藏大学信息科学技术学院
出处
《高原科学研究》
2018年第2期97-104,共8页
基金
国家重点研发计划项目(2017YFB1402200)
西藏自治区科技计划重大科技专项(ZDZX2017000136)
西藏自治区科技计划重点项目(2015XZ01G25)
文摘
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理、动词及物性处理、格助词处理等;为解决平行语料不足导致的数据稀疏问题,对基于中介语言的词语翻译模型进行了改进,融合了基于中介语言的统计翻译模型和直接翻译模型;应用"少监督"的方法,改善了统计机器翻译模型训练过程的盲目性、低效性、冗余性和表面性等缺陷,并将这种方法加入到现有的训练过程得到改善的训练方法。
关键词
汉藏机器翻译
调序算法
树到串
翻译
模型
自动分词与标注
Keywords
Chinese-Tibetan machine translation
sequence algorithm
tree-to-string translation model
auto.matic word segmentation and tagging
分类号
H085 [语言文字]
在线阅读
下载PDF
职称材料
题名
基于改进字节对编码的汉藏机器翻译研究
3
作者
头旦才让
仁青东主
尼玛扎西
于永斌
邓权芯
机构
青海师范大学藏文信息处理教育部重点实验室
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2021年第2期249-255,293,共8页
基金
国家自然科学基金(61262051)
国家社会科学基金(19XYY021)
+1 种基金
国家重点研发计划重点专项(2017YFB1402200)
青海省科技计划(2017-GX-146,2017-ZJ-767)。
文摘
该文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型。通过测试和验证,模型的BLEU值达到36.84。该模型的命名实体翻译效果优于已商用汉藏在线翻译系统。同时,该文的神经机器翻译模型已部署于汉藏机器翻译网站,实现了汉藏神经机器翻译系统的应用推广。
关键词
注意力机制
字节对编码
汉藏
神经
机器翻译
命名实体识别
Keywords
attention mechanism
byte pair Encoding
Chinese-Tibetan neural machine translation
named entity recognition
分类号
TP391.1 [自动化与计算机技术]
在线阅读
下载PDF
职称材料
题名
面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究
4
作者
才让加
机构
青海师范大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2011年第6期157-161,共5页
基金
国家自然科学基金资助项目(61063033)
973前期研究专项资助项目(2010CB334708)
教育部“长江学者和创新团队发展计划”资助项目(IRT1068)
文摘
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高起点起步,需要对汉藏双语文本的篇章级、段落级、句子级自动对齐技术进行研究,为开发和研究汉藏机器翻译奠定基础。主要研究汉藏双语语料库对齐、汉藏双语词典抽取、双语语料的收集、整理、存储以及检索等关键技术。最终研究结果是藏文编码的自动识别与转换技术,藏语语料库构建技术、汉藏双语词典抽取技术、汉藏平行语料库句子和词语对齐技术,并建立面向汉藏机器翻译的大规模汉藏双语对齐语料库。
关键词
汉藏机器翻译
汉藏
双语语料库
编码
对齐技术
Keywords
Chinese-Tibetan machine translation
Chinese-Tibetan bilingual corpus
coding
alignment technology
分类号
TP391 [自动化与计算机技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
汉藏机器翻译的特点与手写汉字切分分析研究
杨宪泽
陈毅红
《计算机工程与科学》
CSCD
北大核心
2014
在线阅读
下载PDF
职称材料
2
基于统计的汉藏机器翻译系统关键技术研究与实现
群诺
尼玛扎西
完么扎西
嘎玛扎西
《高原科学研究》
2018
在线阅读
下载PDF
职称材料
3
基于改进字节对编码的汉藏机器翻译研究
头旦才让
仁青东主
尼玛扎西
于永斌
邓权芯
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2021
在线阅读
下载PDF
职称材料
4
面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究
才让加
《中文信息学报》
CSCD
北大核心
2011
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部