期刊文献+
共找到143篇文章
< 1 2 8 >
每页显示 20 50 100
维吾尔语机器翻译研究综述 被引量:2
1
作者 哈里旦木·阿布都克里木 侯钰涛 +2 位作者 姚登峰 阿布都克力木·阿布力孜 陈吉尚 《计算机工程》 CSCD 北大核心 2024年第1期1-16,共16页
维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语... 维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语机器翻译发展的不同阶段,研究人员针对其特点在算法和模型上不断优化与创新,取得了一定的研究成果,但缺乏系统性的综述。全面回顾维吾尔语机器翻译的相关研究,并根据方法的不同将其分为基于规则和实例的维吾尔语机器翻译、基于统计的维吾尔语机器翻译以及基于神经网络的维吾尔语机器翻译3种类型,同时对相关学术活动和语料库资源进行汇总。为进一步探索维吾尔语机器翻译的潜力,采用ChatGPT模型对维吾尔语-汉语机器翻译任务进行初步研究,实验结果表明,在Few-shot情景下,随着示例数的增加,翻译性能先升后降,在10-shot时表现最佳。此外,思维链方法在维吾尔语机器翻译任务中并未展示出更优的翻译能力。最后对维吾尔语机器翻译未来的研究方向进行了展望。 展开更多
关键词 维吾尔语 基于规则和实例的机器翻译 统计机器翻译 神经机器翻译 大语言模型
在线阅读 下载PDF
利用统计搭配模型改进基于实例的机器翻译 被引量:12
2
作者 刘占一 李生 +1 位作者 刘挺 王海峰 《软件学报》 EI CSCD 北大核心 2012年第6期1472-1485,共14页
基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配... 基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3个方面提高EBMT的性能:(1)利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2)通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3)使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU得分提高了4.73~6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU得分提高了1.82个百分点.同时,人工评价结果显示,改进后的半结构化EBMT系统的译文能够表达原文的大部分信息,并且具有较高的流利度. 展开更多
关键词 统计搭配模型 基于实例的机器翻译 实例选择 译文选择
在线阅读 下载PDF
基于实例的汉蒙机器翻译 被引量:16
3
作者 侯宏旭 刘群 那顺乌日图 《中文信息学报》 CSCD 北大核心 2007年第4期65-72,共8页
本文通过对汉蒙机器翻译方法的研究,给出了一种基于实例的汉蒙机器翻译方法,并加以了实现。本文给出了用于汉蒙EBMT机器翻译的实例搜索以及短语片段划分、匹配、组合的方法。本文给出的方法是基于词语对齐的,利用词语对齐进行词语的匹配... 本文通过对汉蒙机器翻译方法的研究,给出了一种基于实例的汉蒙机器翻译方法,并加以了实现。本文给出了用于汉蒙EBMT机器翻译的实例搜索以及短语片段划分、匹配、组合的方法。本文给出的方法是基于词语对齐的,利用词语对齐进行词语的匹配,并根据匹配词数和长度计算相似度,选取最好的实例。通过对齐信息,确定片段组合的策略,生成翻译结果。通过对方法的实现和实验,完成了一个基于实例的汉蒙机器翻译系统。 展开更多
关键词 人工智能 机器翻译 蒙古语 基于实例 词语对齐
在线阅读 下载PDF
统计机器翻译中实例短语对研究 被引量:3
4
作者 李强 李沐 +1 位作者 张冬冬 朱靖波 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第1期113-119,共7页
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻... 针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上,与基线系统相比,该方法在多个测试集上明显提高了翻译系统的翻译质量,在部分测试集上BLEU值可提高1%左右。 展开更多
关键词 统计机器翻译 基于短语 基于实例 短语对
在线阅读 下载PDF
一种基于实例的汉英机器翻译策略 被引量:5
5
作者 胡国全 陈家骏 +1 位作者 戴新宇 尹存燕 《计算机工程与设计》 CSCD 北大核心 2005年第4期900-903,906,共5页
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也... 介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。 展开更多
关键词 自然语言处理 机器翻译 实例 EBMT技术
在线阅读 下载PDF
基于实例相似度检测的蒙汉机器翻译方法 被引量:6
6
作者 苏依拉 刘婉婉 乌尼尔 《北京工业大学学报》 CAS CSCD 北大核心 2017年第9期1366-1372,共7页
针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的... 针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的蒙古语做出有效的翻译,并在一定程度上提高翻译质量,在蒙汉机器翻译中具有较好的应用价值. 展开更多
关键词 实例机器翻译 蒙古语 相似度算法 对齐
在线阅读 下载PDF
基于实例的汉英机器翻译系统研究与实现 被引量:14
7
作者 王长胜 刘群 《计算机工程与应用》 CSCD 北大核心 2002年第8期126-127,135,共3页
文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、... 文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、翻译结果的正确率等方面取得了令人满意的结果。 展开更多
关键词 汉英机器翻译系统 实例 双语语料库 计算机
在线阅读 下载PDF
基于实例的机器翻译处理方法 被引量:16
8
作者 杨宪泽 《计算机工程》 CAS CSCD 北大核心 2003年第21期51-52,135,共3页
在机器翻译的研究中,基于实例是一种很好的方法。文章讨论了完全实例的机器 翻译、实例句型转换的机器翻译以及实例近似机器翻译。
关键词 机器翻译 基于实例 映射检索 规则索引
在线阅读 下载PDF
智能型俄汉机器翻译系统的句法规则库的设计原则 被引量:4
9
作者 李向东 周清波 +2 位作者 黄河燕 张昕 张新红 《中文信息学报》 CSCD 北大核心 1999年第1期16-19,共4页
本文提出了建立智能型俄汉机器翻译系统句法规则库的6条原则:以谓语动词作为句子结构关系的中心;语法、语义信息一体化;常见词序优先;以函数形式反映俄语句法的制约关系;强制性认定及源语言分析与目标语生成同步进行。
关键词 机器翻译 句法规则 智能型 俄语 汉族 RCIMT
在线阅读 下载PDF
机器翻译中规则和模板的协调方法研究 被引量:3
10
作者 孙广范 宋金平 袁琦 《中文信息学报》 CSCD 北大核心 2006年第B03期31-35,共5页
本文讨论了机器翻译中的基于规则、基于翻译模板及转换模型的特点,分别比较了它们的优点和不足。同时讨论了协调基于模板方法与基于转换模型方法的合理途径。针对研制机器翻译系统的需要设计了将这几种方法有机地结合起来的算法。将本... 本文讨论了机器翻译中的基于规则、基于翻译模板及转换模型的特点,分别比较了它们的优点和不足。同时讨论了协调基于模板方法与基于转换模型方法的合理途径。针对研制机器翻译系统的需要设计了将这几种方法有机地结合起来的算法。将本文提出的协调方法在汉英双向机器翻译系统中应用,取得了较好的实验结果。通过采用模板和去掉模板分别进行翻译实验,结果表明基于模板方法对于译文质量提高的贡献率分别为:口语为12%,篇章翻译为8%。 展开更多
关键词 规则 翻译模板 转换模型 机器翻译
在线阅读 下载PDF
基于翻译规则的统计机器翻译 被引量:4
11
作者 刘颖 姜巍 《计算机科学》 CSCD 北大核心 2013年第2期214-217,共4页
扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆斯基范式的翻译规则;采用两轮解码算法... 扩展HMM模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利用目标语言的短语结构树抽取翻译规则。采用扩展CYK算法CYKA+作为系统的解码器,该算法可以处理非乔姆斯基范式的翻译规则;采用两轮解码算法在解码过程中整合语言模型。实验表明,与传统词语对齐模型相比,改进的HMM词语对齐模型具有更高的对齐准确率,并且翻译结果的BLEU评测得分更高。采用翻译规则的系统在不同数据集上具有更稳定的翻译结果。两轮解码算法与立方剪枝算法具有相近的解码质量,但前者解码速度更快。 展开更多
关键词 统计机器翻译 扩展HMM模型 翻译规则 CYK+算法 BLEU评分
在线阅读 下载PDF
基于粘着性模糊规则的维汉机器翻译最大熵调序研究 被引量:2
12
作者 陈科海 周喜 +1 位作者 杨雅婷 米成刚 《计算机应用研究》 CSCD 北大核心 2013年第9期2587-2590,2605,共5页
针对维汉机器翻译中未登录词和译文乱序问题严重的现象,结合维吾尔语粘着性语言特点以及最大熵分类算法,提出了一种基于粘着性模糊规则的维汉机器翻译最大熵调序模型。该模型以最大熵模型为基础,在维吾尔语词级别构建粘着性规则约束,从... 针对维汉机器翻译中未登录词和译文乱序问题严重的现象,结合维吾尔语粘着性语言特点以及最大熵分类算法,提出了一种基于粘着性模糊规则的维汉机器翻译最大熵调序模型。该模型以最大熵模型为基础,在维吾尔语词级别构建粘着性规则约束,从训练语料中提取更加有效的调序规则来指导翻译解码过程。实验证明,与当前主要MSD(mono、swap、discontinuous)等调序方法相比,该方法较好地体现了维吾尔语的粘着性特点,提高了译文质量。 展开更多
关键词 维汉机器翻译 形态学 粘着性 模糊规则 最大熵 调序模型
在线阅读 下载PDF
多策略机器翻译系统IHSMTS中实例模式泛化匹配算法 被引量:1
13
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 胡春玲 《中文信息学报》 CSCD 北大核心 2005年第4期1-9,共9页
基于精确匹配的EBMT,由于翻译覆盖率过低,导致其难以大规模实际应用。本文提出一种实例模式泛化匹配算法,试图改善EBMT的翻译覆盖率:以输入的待翻译句子为目标导向,对候选翻译实例有针对性地进行实时泛化,使得算法既能满足实时文档翻译... 基于精确匹配的EBMT,由于翻译覆盖率过低,导致其难以大规模实际应用。本文提出一种实例模式泛化匹配算法,试图改善EBMT的翻译覆盖率:以输入的待翻译句子为目标导向,对候选翻译实例有针对性地进行实时泛化,使得算法既能满足实时文档翻译对速度的要求,又能充分利用系统使用过程中用户新添加和修改的翻译知识,从而总体上提高了系统的翻译覆盖率和翻译质量。实验结果表明,在语料规模为16万句对的情况下,系统翻译覆盖率达到了75%左右,充分说明了本文算法的有效性。 展开更多
关键词 人工智能 机器翻译 基于实例的机器翻译 泛化匹配 翻译覆盖率
在线阅读 下载PDF
基于弱化语法规则的英文机器翻译的优化研究 被引量:3
14
作者 赵足娥 李培隆 《现代电子技术》 北大核心 2017年第22期27-29,共3页
针对传统英文机器翻译过于依赖专家总结,而对弱化规则下英文翻译误差大的缺点,提出一种基于弱化语法规则的英文机器翻译优化算法。该算法对英文的语法规则进行分析,再对语义进行高斯边缘化获取其矩形窗函数,得到窗口特征向量,投影语义... 针对传统英文机器翻译过于依赖专家总结,而对弱化规则下英文翻译误差大的缺点,提出一种基于弱化语法规则的英文机器翻译优化算法。该算法对英文的语法规则进行分析,再对语义进行高斯边缘化获取其矩形窗函数,得到窗口特征向量,投影语义信息熵数据,并将语义关联因素加入到文本的信息熵与信息增益中去,从而得到语义非线性谱特征。最终实现特征识别,解决了传统英文机器翻译误差大的问题。最后对提出的算法进行仿真验证,结果表明使用该算法可以得到较好的英文翻译效果,从而证明了该算法的发展空间较好。 展开更多
关键词 英文机器翻译 弱化语法规则 信息熵 特征识别
在线阅读 下载PDF
规则与统计结合进行汉英机器翻译消歧 被引量:4
15
作者 刘颖 《计算机应用》 CSCD 北大核心 2002年第5期21-23,30,共4页
采用基于转换的方法进行汉英机器翻译 ,在机器翻译的每个阶段 (汉语切分、词性标注、句法语义分析、树转换、词串生成 )采用规则方法和统计方法相结合来进行消歧。实验结果表明
关键词 规则 统计 汉英机器翻译 消歧 计算机
在线阅读 下载PDF
规则与统计相结合的主谓谓语句的日汉机器翻译研究 被引量:1
16
作者 熊苇渡 《理论月刊》 CSSCI 北大核心 2013年第4期79-82,共4页
主谓谓语句是由主谓短语充当谓语的句子,汉日两种语言中均存在该句式,但两者各有特点,翻译时并不一一对应。有时会出现汉语是主谓谓语句,而日语变成其他句式的情况。这对汉日机器翻译的发展造成了一定的困难。机器翻译发展到现在,依赖... 主谓谓语句是由主谓短语充当谓语的句子,汉日两种语言中均存在该句式,但两者各有特点,翻译时并不一一对应。有时会出现汉语是主谓谓语句,而日语变成其他句式的情况。这对汉日机器翻译的发展造成了一定的困难。机器翻译发展到现在,依赖基于规则的方法或基于统计的方法。两者各有利弊,只有将它们相结合,在基于规则的机器翻译方法中,利用语料库资源,采用统计学和机器学习的技术解决机器翻译中的局部问题,进而提高整体性能。本文以汉日两种语言的主谓谓语句为研究对象,考察其范围、类型、对应情况,建立相应的规则,进而与统计的方法相结合,为机器翻译服务。 展开更多
关键词 机器翻译 规则与统计 主谓谓语句 格式判断 翻译策略
在线阅读 下载PDF
机器翻译系统中词类搭配规则的自动获取方法
17
作者 孙杰 李晶皎 +1 位作者 张俐 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 1999年第2期140-143,共4页
讨论了词类搭配的特点和形式描述问题·提出了一种机器翻译系统中词类搭配规则的自动获取方法,称为CRAM·该方法利用词类的相关性并引入机器学习技术,构造二叉树形式的分类决策树,能够从带有词类和语义标注的语料中获取... 讨论了词类搭配的特点和形式描述问题·提出了一种机器翻译系统中词类搭配规则的自动获取方法,称为CRAM·该方法利用词类的相关性并引入机器学习技术,构造二叉树形式的分类决策树,能够从带有词类和语义标注的语料中获取用于词类有序消岐的搭配规则,与汉英机译系统(CETRAN)的结合应用表明了此方法的有效性· 展开更多
关键词 知识获取 词类搭配规则 机器翻译系统 自动获取
在线阅读 下载PDF
基于单词规则的英汉机器翻译和消歧研究
18
作者 谢金宝 孙岗 杨振宇 《情报学报》 CSSCI 北大核心 1997年第5期370-375,共6页
本文比较各种机器翻译方法的特点,借鉴短语结构、GPSG、HPSG和语料库等计算语言学理论,采用以单词为核心的方法,建立一组以1000单词为背景的英汉翻译规则,并实现以单词规则、通用规则为准,进行英汉翻译的机译系统。本... 本文比较各种机器翻译方法的特点,借鉴短语结构、GPSG、HPSG和语料库等计算语言学理论,采用以单词为核心的方法,建立一组以1000单词为背景的英汉翻译规则,并实现以单词规则、通用规则为准,进行英汉翻译的机译系统。本文还对机译系统构成、设计、词典结构等技术问题进行了探讨,并提出一套规则和结点的评价方法,为消除机器翻译中的句法歧义做了有益的尝试。 展开更多
关键词 机器翻译 规则 语素 歧义 英汉翻译
在线阅读 下载PDF
统计机器翻译中翻译规则抽取
19
作者 刘颖 姜巍 《计算机工程与应用》 CSCD 2012年第32期98-101,146,共5页
对齐短语是决定统计机器翻译系统质量的核心模块。提出基于短语结构树的层次短语模型,这是利用串-树模型的思想对层次短语模型的扩展。基于短语结构树的层次短语模型是在双语对齐短语的基础之上结合英语短语结构树抽取翻译规则,并利用... 对齐短语是决定统计机器翻译系统质量的核心模块。提出基于短语结构树的层次短语模型,这是利用串-树模型的思想对层次短语模型的扩展。基于短语结构树的层次短语模型是在双语对齐短语的基础之上结合英语短语结构树抽取翻译规则,并利用启发式策略获得翻译规则的扩展句法标记。采用翻译规则的统计机器翻译系统在不同数据集上具有稳定的翻译结果,在训练集和测试集的平均BlEU评分高于短语模型和层次短语模型的BLEU评分。 展开更多
关键词 统计机器翻译 翻译规则 抽取 过滤 BLEU评分
在线阅读 下载PDF
多策略机器翻译系统IHSMTS中候选实例模式检索算法 被引量:2
20
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 代六玲 《小型微型计算机系统》 CSCD 北大核心 2005年第3期330-334,共5页
基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是... 基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是EBMT系统所必须解决的一大难题.文章基于句子的词表层特征和信息熵提出了一种多层次候选实例模式检索算法,通过在多策略机器翻译系统IHSMTS上的运行测试,结果表明该算法较好的解决了这一难题. 展开更多
关键词 基于实例的机器翻译 实例模式库 候选实例 词表层特征 信息熵
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部