-
题名基于多粒度的英汉人名音译
被引量:4
- 1
-
-
作者
于恒
凃兆鹏
刘群
刘洋
-
机构
中国科学院计算技术研究所智能信息重点实验室
清华大学计算机科学与技术系
-
出处
《中文信息学报》
CSCD
北大核心
2013年第4期16-21,共6页
-
基金
国家863重大项目资助(2011AA01A207)
-
文摘
音译是解决人名翻译的重要方法。在英汉人名音译问题中,翻译粒度问题一直是研究的重点之一。该文提出一种基于多粒度的英汉人名音译方法。将多种粒度的英文切分通过词图进行融合,并使用层次短语模型进行解码,从而缓解了由于切分错误而导致的音译错误,提高了系统的鲁棒性。实验结果表明基于多粒度的音译方法融合了基于各种粒度音译方法的优点,在准确率上提高了3.1%,在BLEU取得了2.2个点的显著提升。
-
关键词
人名音译
多粒度
词图
-
Keywords
name entity machine transliterationl multi-granularity~ word-lattice
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉—藏人名用字音译规则研究
被引量:3
- 2
-
-
作者
龙从军
豆格才让
刘汇丹
-
机构
中国社会科学院民族学与人类学研究所
西藏自治区编译局
中国科学院软件研究所
-
出处
《中文信息学报》
CSCD
北大核心
2018年第3期71-76,共6页
-
基金
国家语委重点项目(ZDI135-17)
国家语委一般项目(YB125-180)
-
文摘
随着信息技术的发展,藏文在互联网上广泛使用,政府主办的报刊、杂志也逐渐有了网络版,大量的汉文材料被翻译成藏文。翻译者在音译汉文人名用字时,未能遵从统一的音译规范,导致同一人名存在多种音译形式。该文统计了五家藏文网站,发现一些公众人物的人名用字音译形式比较混乱,不但影响信息交流,而且不利于藏文自然语言处理。该文详细分析了音译混乱的原因,提出在汉—藏人名用字音译时,需要制定一一对应的音译原则;同时注重原则实践的可行性和一致性。翻译者在音译汉—藏人名用字时必须严格遵从音译原则;推行音译原则还需要依靠相关政府机构和部门。
-
关键词
汉—藏人名
人名音译
音译原则
-
Keywords
Chinese-Tibetan person's names
name transliteration
transliteration principles
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名现代维吾尔语人名汉字音译转写关键技术研究
被引量:1
- 3
-
-
作者
阿力木.木拉提
艾孜尔古丽
玉素甫.艾白都拉
-
机构
新疆师范大学网络信息安全与舆情分析重点实验室
-
出处
《计算机工程与应用》
CSCD
2014年第9期209-213,共5页
-
基金
国家自然科学基金重点项目(No.61132009)
国家自然科学基金(No.61262066
+5 种基金
No.61063036)
国家语委科研规划项目(No.YB115-38
No.YB125-45)
新疆师范大学研究生创新基金项目(No.20121206)
新疆师范大学重点实验室开放课题(No.WLYQ2012201
No.WLYQ2012204)
-
文摘
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。
-
关键词
维吾尔语
音节切分
维吾尔人名汉字音译转写
自动翻译
-
Keywords
Uyghur
syllable segmentation
Uyghur name transliteration to Chinese characters
automatic translation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-