期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
机器音译研究综述
1
作者 李卓 王志娟 赵小兵 《中文信息学报》 CSCD 北大核心 2024年第7期1-17,共17页
机器音译是基于语音相似性自动将文本从一种语言转换为另一种语言的过程,其是机器翻译的一个子任务,侧重于语音信息的翻译。音译后可知道源单词在另一种语言中的发音,使不熟悉源语言的人更容易理解该语言,有益于消除语言和拼写障碍。机... 机器音译是基于语音相似性自动将文本从一种语言转换为另一种语言的过程,其是机器翻译的一个子任务,侧重于语音信息的翻译。音译后可知道源单词在另一种语言中的发音,使不熟悉源语言的人更容易理解该语言,有益于消除语言和拼写障碍。机器音译在多语言文本处理、语料库对齐、信息抽取等自然语言应用中发挥着重要作用。该文阐述了目前机器音译任务中存在的挑战,对主要的音译方法进行了剖析、分类和整理,对音译数据集进行了罗列汇总,并列出了常用的音译效果评价指标,最后对该领域目前存在的问题进行了说明,并对音译学的未来进行了展望。该文旨在为进入该领域的新人提供快速的入门指南,或供其他研究者参考。 展开更多
关键词 音译 综述 语料库 评价指标
在线阅读 下载PDF
藏文拉丁转写的研究与实现 被引量:13
2
作者 陈丽娜 祁坤钰 +2 位作者 贾彦民 吴健 康丽 《计算机工程与设计》 CSCD 北大核心 2006年第1期15-17,105,共4页
藏文拉丁转写是研究藏文化和进行藏文术语交流的重要工具。介绍了一种基于藏文编码字符集基本集和藏文编码字符集扩充集A,实现藏文拉丁转写的方法。通过引入垂直预组合的概念,将藏文由复杂文本变为简单文本,从而简化了拉丁转写的处理过... 藏文拉丁转写是研究藏文化和进行藏文术语交流的重要工具。介绍了一种基于藏文编码字符集基本集和藏文编码字符集扩充集A,实现藏文拉丁转写的方法。通过引入垂直预组合的概念,将藏文由复杂文本变为简单文本,从而简化了拉丁转写的处理过程,降低了算法复杂度。详细讲述了算法的原理及在OpenOffice.org中的实现。 展开更多
关键词 藏文 藏文信息处理 拉丁转写 垂直预组合
在线阅读 下载PDF
利用音译和网络挖掘翻译命名实体 被引量:11
3
作者 蒋龙 周明 简立峰 《中文信息学报》 CSCD 北大核心 2007年第1期23-29,共7页
本文提出了一种新颖的方法,综合利用音译和网络挖掘来提高命名实体翻译的效果。具体而言,首先利用音译模型生成一个候选翻译,然后利用音译信息配合网络挖掘获得更多的候选翻译。最后,使用最大熵(MaximumEntropy)模型综合考虑源词和候选... 本文提出了一种新颖的方法,综合利用音译和网络挖掘来提高命名实体翻译的效果。具体而言,首先利用音译模型生成一个候选翻译,然后利用音译信息配合网络挖掘获得更多的候选翻译。最后,使用最大熵(MaximumEntropy)模型综合考虑源词和候选翻译之间的各种特征,如发音相似度,上下文本特征,网页共现关系等,来排序得到的候选翻译,从而决定最终的翻译结果。实验结果显示我们的方法显著的提高了命名实体翻译的精确度。 展开更多
关键词 人工智能 机器翻译 音译 命名实体翻译 网络挖掘
在线阅读 下载PDF
汉—藏人名用字音译规则研究 被引量:3
4
作者 龙从军 豆格才让 刘汇丹 《中文信息学报》 CSCD 北大核心 2018年第3期71-76,共6页
随着信息技术的发展,藏文在互联网上广泛使用,政府主办的报刊、杂志也逐渐有了网络版,大量的汉文材料被翻译成藏文。翻译者在音译汉文人名用字时,未能遵从统一的音译规范,导致同一人名存在多种音译形式。该文统计了五家藏文网站,发现一... 随着信息技术的发展,藏文在互联网上广泛使用,政府主办的报刊、杂志也逐渐有了网络版,大量的汉文材料被翻译成藏文。翻译者在音译汉文人名用字时,未能遵从统一的音译规范,导致同一人名存在多种音译形式。该文统计了五家藏文网站,发现一些公众人物的人名用字音译形式比较混乱,不但影响信息交流,而且不利于藏文自然语言处理。该文详细分析了音译混乱的原因,提出在汉—藏人名用字音译时,需要制定一一对应的音译原则;同时注重原则实践的可行性和一致性。翻译者在音译汉—藏人名用字时必须严格遵从音译原则;推行音译原则还需要依靠相关政府机构和部门。 展开更多
关键词 汉—藏人名 人名音译 音译原则
在线阅读 下载PDF
旗袍英译名考辨 被引量:5
5
作者 彭朝忠 饶萍 《丝绸》 CAS CSCD 北大核心 2016年第10期65-69,共5页
中国旗袍,历百年变迁而不衰,虽然款式、做工等方面有过多次变革,但其"一件制"表现形式和中文名称等基本保持一致。值得关注的是,旗袍的英文译名却有Cheongsam、Qipao、Qi Pao、Chipao、Chirpaur、Mandarin gown、Chinese dres... 中国旗袍,历百年变迁而不衰,虽然款式、做工等方面有过多次变革,但其"一件制"表现形式和中文名称等基本保持一致。值得关注的是,旗袍的英文译名却有Cheongsam、Qipao、Qi Pao、Chipao、Chirpaur、Mandarin gown、Chinese dress等多种表达形式,可谓五花八门,不仅容易误导西方受众,也不利于中国旗袍文化的对外传播。文章首先从国内外普通消费和学术研究两方面概述旗袍英译名称混乱的现状,然后逐一分析和对比这些译名出现的原因,进而提出旗袍最合理的译名,并根据当前现实提出了译名统一的建议。 展开更多
关键词 旗袍 长衫 英译名 音译 服饰文化
在线阅读 下载PDF
汉语外来词音译回潮之文化剖析 被引量:7
6
作者 辛红娟 宋子燕 《中南大学学报(社会科学版)》 CSSCI 2012年第6期220-224,共5页
语言在同他族语言交际的过程中,会直接或间接地从与之接触的语言文化中借用本族语言文化所缺少的东西,这种表达的空缺造成大量外来词的出现。日益剧增的外来词使得原有的词汇不能适应新的命名和表达的需要,汉语面临着命名的危机,音译词... 语言在同他族语言交际的过程中,会直接或间接地从与之接触的语言文化中借用本族语言文化所缺少的东西,这种表达的空缺造成大量外来词的出现。日益剧增的外来词使得原有的词汇不能适应新的命名和表达的需要,汉语面临着命名的危机,音译词因而成为语言借贷行为种日益显露的"群体"。通过对汉语外来语中的音译词展开文化层面的分析,认为音译词除反映了本民族的审美心理、求吉心理,彰显本民族文化的"互文",也体现了对异质文化之"异"的认同和尊重。 展开更多
关键词 外来词 音译 文化分析
在线阅读 下载PDF
英汉机器音译系统对比研究 被引量:2
7
作者 高恩婷 段湘煜 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第2期287-294,共8页
针对机器音译的两种主要方法——传统的基于统计的方法和目前流行的基于深度神经网络的方法,分别使用两种典型系统进行研究。实验结果显示,基于统计的方法和基于深度神经网络的方法取得的音译质量在评测指标上相当,但在具体音译结果上... 针对机器音译的两种主要方法——传统的基于统计的方法和目前流行的基于深度神经网络的方法,分别使用两种典型系统进行研究。实验结果显示,基于统计的方法和基于深度神经网络的方法取得的音译质量在评测指标上相当,但在具体音译结果上各系统间呈现不一致的输出。使用系统融合的方法来实现各系统间的优势互补。实验结果显示,系统融合的方法显著优于单系统的音译质量。 展开更多
关键词 机器音译 音译对齐 统计方法 深度神经网络方法
在线阅读 下载PDF
基于词或词组长度和频数的短中文文本关键词提取算法 被引量:14
8
作者 陈伟鹤 刘云 《计算机科学》 CSCD 北大核心 2016年第12期50-57,共8页
中文文本的关键词提取是自然语言处理研究中的难点。国内外大部分关键词提取的研究都是基于英文文本的,但其并不适用于中文文本的关键词提取。已有的针对中文文本的关键词提取算法大多适用于长文本,如何从一段短中文文本中准确地提取出... 中文文本的关键词提取是自然语言处理研究中的难点。国内外大部分关键词提取的研究都是基于英文文本的,但其并不适用于中文文本的关键词提取。已有的针对中文文本的关键词提取算法大多适用于长文本,如何从一段短中文文本中准确地提取出具有实际意义且与此段中文文本的主题密切相关的词或词组是研究的重点。提出了面向中文文本的基于词或词组长度和频数的关键词提取算法,此算法首先提取文本中出现频数较高的词或词组,再根据这些词或词组的长度以及在文本中出现的频数计算权重,从而筛选出关键词或词组。该算法可以准确地从中文文本中提取出相对重要的词或词组,从而快速、准确地提取此段中文文本的主题。实验结果表明,基于词或词组长度和频数的中文文本关键词提取算法与已有的其他算法相比,可用于处理中文文本,且具有更高的准确性。 展开更多
关键词 关键词提取 中文文本处理 音译词 网络新词
在线阅读 下载PDF
音译用字的文字学考察 被引量:26
9
作者 龚雪梅 《福建师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2006年第4期108-112,共5页
本文从文字学的角度考察了音译用字的情况,认为音译实际上是继承了中国传统的“假借”机制,音译用字实现了汉字记录功能的扩展和完善。文章还对音译用字的“汉化”现象进行了归纳和分析,有助于人们从一个特殊的角度来理解翻译用字和汉... 本文从文字学的角度考察了音译用字的情况,认为音译实际上是继承了中国传统的“假借”机制,音译用字实现了汉字记录功能的扩展和完善。文章还对音译用字的“汉化”现象进行了归纳和分析,有助于人们从一个特殊的角度来理解翻译用字和汉字文化的内在联系。 展开更多
关键词 音译 文字学
在线阅读 下载PDF
基于小字符集藏文拉丁转写系统的设计与实现 被引量:4
10
作者 陈小莹 艾金勇 《中文信息学报》 CSCD 北大核心 2016年第3期74-78,共5页
随着藏语语言信息技术的迅速发展,藏文拉丁转写成为迫切需要解决的重要课题之一。该文在前人有关藏文拉丁转写研究的基础上,设计并实现了基于小字符集方案的藏文拉丁转写系统。文章通过对小字符集编码方案的特征分析,同时根据藏文正字... 随着藏语语言信息技术的迅速发展,藏文拉丁转写成为迫切需要解决的重要课题之一。该文在前人有关藏文拉丁转写研究的基础上,设计并实现了基于小字符集方案的藏文拉丁转写系统。文章通过对小字符集编码方案的特征分析,同时根据藏文正字法知识,提出了基于小字符集编码的藏文拉丁转写算法,并对具体算法策略进行了分析和说明,最后在Windows平台进行了程序的实现。藏文拉丁转写方案的设计与实现,可以解决藏文多编码系统之间的兼容性问题。 展开更多
关键词 藏文 拉丁转写 小字符集 占位辅音
在线阅读 下载PDF
溪母字与见母字读音混同现象考析——以敦煌汉藏对音资料为例 被引量:3
11
作者 史淑琴 杨富学 《青海民族研究》 CSSCI 北大核心 2012年第4期149-153,共5页
敦煌文献中有一类特殊的古藏文卷子,用藏文为汉字注音译音,即汉藏对音材料。这类资料中一般藏文[ka]对应见母字,[kha]对应溪母字,其中异常的是部分溪母字与见母字的对音相同。学界多认为这是一种"误读",其实并非如此简单。通... 敦煌文献中有一类特殊的古藏文卷子,用藏文为汉字注音译音,即汉藏对音材料。这类资料中一般藏文[ka]对应见母字,[kha]对应溪母字,其中异常的是部分溪母字与见母字的对音相同。学界多认为这是一种"误读",其实并非如此简单。通过对比回鹘文、日文译音、汉字注音中类似的现象,分析其移民、方言特点,可以推断这应是当时当地汉语方言中部分溪母字与见母字读音混同的一种特殊现象,体现了古代民族间的文化交融。 展开更多
关键词 敦煌文献 汉藏对音 见母 溪母 方言
在线阅读 下载PDF
藏文同元码与基本集相互转换的规则与实现 被引量:1
12
作者 武光利 于洪志 柳春 《计算机工程与应用》 CSCD 北大核心 2009年第29期134-136,共3页
在当今的计算机信息处理过程中,不同文字处理平台上相同字符的不同编码问题,即文字处理的不兼容,是一个亟待解决的重要问题。而在藏文信息处理的研究中,藏文的编码转换也是一个研究热点。藏文的文本、网站大多采用同元编码方式,而微软的... 在当今的计算机信息处理过程中,不同文字处理平台上相同字符的不同编码问题,即文字处理的不兼容,是一个亟待解决的重要问题。而在藏文信息处理的研究中,藏文的编码转换也是一个研究热点。藏文的文本、网站大多采用同元编码方式,而微软的Vista操作系统采用的是基本集的编码方式,所以两种编码的转换在藏文信息处理领域是非常重要的。主要介绍了藏文同元编码与基本集的相互转换技术,采用了将藏文按照拉丁转写拆分的方法,利用层数作为藏文同元编码字符结构与基本集编码字符结构的桥梁,通过一系列规则,实现了两种编码的相互转换。 展开更多
关键词 藏文 拉丁转写 同元编码 基本集 编码转换
在线阅读 下载PDF
明末天主教文献所见汉语基督教词汇考述 被引量:8
13
作者 王铭宇 《汉语学报》 CSSCI 北大核心 2013年第4期53-62,96,共10页
本文梳理明末(1582-1644)耶稣会天主教文献所见基督教汉译名词,重点考诠沿用至今的基督教专名凡86个,分属两大类:其一为旧词新用,如"天主、上帝";其二为新造词语,借两种造词方法,一为音译,如"亚当、耶稣",二为意译,... 本文梳理明末(1582-1644)耶稣会天主教文献所见基督教汉译名词,重点考诠沿用至今的基督教专名凡86个,分属两大类:其一为旧词新用,如"天主、上帝";其二为新造词语,借两种造词方法,一为音译,如"亚当、耶稣",二为意译,如"炼狱、福音"。这批词汇乃今用汉语基督教词汇之源头,亟待解明。 展开更多
关键词 基督教 天主教 新词 音译 意译
在线阅读 下载PDF
明代南京官话性质考释 被引量:20
14
作者 曾晓渝 《语言科学》 CSSCI 北大核心 2016年第2期178-187,共10页
针对目前学界的相关争论焦点问题,文章通过七种对音材料音系特点的考察比较,论证了明代南京官话具有权威通用性,而明代"南京官话"之名并非仅有"南京方言"之实;明代南京官话的基础音系具有江淮、中原官话的综合性质... 针对目前学界的相关争论焦点问题,文章通过七种对音材料音系特点的考察比较,论证了明代南京官话具有权威通用性,而明代"南京官话"之名并非仅有"南京方言"之实;明代南京官话的基础音系具有江淮、中原官话的综合性质(其中相当部分与北京官话重合),实际上是个动态弹性系统。 展开更多
关键词 明代南京官话 官话方言 基础音系 对音材料 动态综合性
在线阅读 下载PDF
林谦三为何改动《仁智要录》平调、盘涉调的声名? 被引量:3
15
作者 于韵菲 《黄钟(武汉音乐学院学报)》 CSSCI 北大核心 2009年第1期148-154,共7页
在比对《仁智要录》调子品原文之后,可以发现,林谦三在《东亚乐器考》中改动了平调与盘涉调的声名,即把宫、商、角、变徵、徵、羽、变宫分别改成了羽、变宫、宫、商、角、变徵、徵。本文认为:(1)作为深谙中国乐律的日本专家,林谦三所不... 在比对《仁智要录》调子品原文之后,可以发现,林谦三在《东亚乐器考》中改动了平调与盘涉调的声名,即把宫、商、角、变徵、徵、羽、变宫分别改成了羽、变宫、宫、商、角、变徵、徵。本文认为:(1)作为深谙中国乐律的日本专家,林谦三所不言明的改动,非但无误,且意义深远;(2)这一改动,揭示了日本"律"体系中的平调、盘涉调实为中国羽调的实质,由此反推,将中国的羽呼为宫正是日本"律"的成因;(3)日本"律"的形成虽有"宫羽相犯"之形式,却无"宫羽相犯"之实质,可谓不彻底的"犯调";(4)与带有"婴商、婴羽"等声名的日本"律"相比较,《仁智要录》平调和盘涉调定弦反映了日本"律"的早期形态。 展开更多
关键词 林谦三 仁智要录 平调 盘涉调 “律” 羽调
在线阅读 下载PDF
新疆地名的音译转写及英译规范 被引量:7
16
作者 付鸿军 虞锐 《新疆大学学报(哲学社会科学版)》 CSSCI 2015年第5期152-156,共5页
新疆地名语源多、组合类型多,源于少数民族语言的地名和国家通用语地名在语音形式上不能一一对应。英译新疆地名因而要遵循特别的规范:源于汉语的地名的汉语拼音即是英语译名;音译自少数民族语言的汉语地名,其汉语拼音的音译转写即是英... 新疆地名语源多、组合类型多,源于少数民族语言的地名和国家通用语地名在语音形式上不能一一对应。英译新疆地名因而要遵循特别的规范:源于汉语的地名的汉语拼音即是英语译名;音译自少数民族语言的汉语地名,其汉语拼音的音译转写即是英语译名;双语地名、同义异音地名和含汉语语素地名的汉语拼音即是英语译名,但要加注少数民族语言的汉语拼音的音译转写形式。遵循这个原则既是执行国家标准和国际规范,又是尊重各民族语言习惯。 展开更多
关键词 新疆地名 音译转写 英译标准
在线阅读 下载PDF
基于多模型融合的人名翻译系统 被引量:2
17
作者 庞薇 徐波 《中文信息学报》 CSCD 北大核心 2009年第1期44-49,共6页
该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的... 该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的优势在于通过从各种信息源得到的数据价值的最大化。实验结果表明,基于多模型融合方法的人名翻译的错误率比单一模型的人名翻译的错误率降低了7.14%。 展开更多
关键词 计算机应用 中文信息处理 多模型融合 音译 命名实体 加权有限状态转换器
在线阅读 下载PDF
基于子词的历史典籍术语对齐方法 被引量:1
18
作者 车超 郑晓军 《中文信息学报》 CSCD 北大核心 2016年第3期46-51,共6页
由于历史典籍术语存在普遍的多义性且缺少古汉语分词算法,使用基于双语平行语料的对齐方法来自动获取典籍术语翻译对困难重重。针对上述问题,该文提出一种基于子词的最大熵模型来进行典籍术语对齐。该方法结合两种统计信息抽取频繁在一... 由于历史典籍术语存在普遍的多义性且缺少古汉语分词算法,使用基于双语平行语料的对齐方法来自动获取典籍术语翻译对困难重重。针对上述问题,该文提出一种基于子词的最大熵模型来进行典籍术语对齐。该方法结合两种统计信息抽取频繁在一起出现的字作为子词,使用子词对典籍进行分词,解决了缺少古汉语分词算法的问题。针对典籍术语的多义性,根据典籍术语的音译模式制定音译特征函数,并结合其他特征使用最大熵模型来确定术语的翻译。在《史记》双语平行语料上的实验表明,使用子词的方法远远优于未使用子词的方法,而结合三种特征的最大熵模型能有效的提高术语对齐的准确率。 展开更多
关键词 子词 术语对齐 最大熵模型 音译特征
在线阅读 下载PDF
新时代涉藏国际传播中藏语专有名词罗马字母音译转写的规范化研究 被引量:4
19
作者 索朗旺姆 《西藏大学学报(社会科学版)》 CSSCI 北大核心 2022年第1期65-72,共8页
新时代涉藏国际传播的主要任务是向外传递真实、准确的信息,消除歧义,展现西藏当下各方面的发展,统一国际社会对中国西藏的认知。目前当务之急是规范化藏语专有名词罗马字母音译转写,杜绝藏语专有名词翻译随意性强、译法多样导致的一名... 新时代涉藏国际传播的主要任务是向外传递真实、准确的信息,消除歧义,展现西藏当下各方面的发展,统一国际社会对中国西藏的认知。目前当务之急是规范化藏语专有名词罗马字母音译转写,杜绝藏语专有名词翻译随意性强、译法多样导致的一名多译的现象。文章介绍了常见的几种藏语专有名词罗马字母转写及各自的特点,提出了适合藏语的音译转写方案,以达到促进规范化藏语专有名词罗马字母音译转写,提高涉藏国际传播的效果。 展开更多
关键词 藏语专有名词 罗马字母音译 规范化 涉藏国际传播
在线阅读 下载PDF
的士"及其相关词语的读音规范问题 被引量:1
20
作者 刘中富 《汉语学习》 北大核心 2003年第3期31-34,共4页
"的士"是一个来自粤方言的音译词。由于"的"字的多音性和粤方言语音的影响,"的士"的读音产生了严重分歧,并造成了与其相关的一系列词语的读音混乱,亟待规范。规范应在不增加"的"字读音的前提... "的士"是一个来自粤方言的音译词。由于"的"字的多音性和粤方言语音的影响,"的士"的读音产生了严重分歧,并造成了与其相关的一系列词语的读音混乱,亟待规范。规范应在不增加"的"字读音的前提下进行,建议采用"d姫sh尙"作为规范读音。 展开更多
关键词 音译词 译音字 粤方言 规范
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部