期刊文献+
共找到347篇文章
< 1 2 18 >
每页显示 20 50 100
基于实例相似度检测的蒙汉机器翻译方法 被引量:6
1
作者 苏依拉 刘婉婉 乌尼尔 《北京工业大学学报》 CAS CSCD 北大核心 2017年第9期1366-1372,共7页
针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的... 针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的蒙古语做出有效的翻译,并在一定程度上提高翻译质量,在蒙汉机器翻译中具有较好的应用价值. 展开更多
关键词 实例机器翻译 蒙古语 相似度算法 对齐
在线阅读 下载PDF
基于实例的机器翻译处理方法 被引量:16
2
作者 杨宪泽 《计算机工程》 CAS CSCD 北大核心 2003年第21期51-52,135,共3页
在机器翻译的研究中,基于实例是一种很好的方法。文章讨论了完全实例的机器 翻译、实例句型转换的机器翻译以及实例近似机器翻译。
关键词 机器翻译 基于实例 映射检索 规则索引
在线阅读 下载PDF
面向标记语言的机器翻译方法研究 被引量:1
3
作者 杜权 曾信 +4 位作者 李北 刘辉 李垠桥 肖桐 朱靖波 《中文信息学报》 CSCD 北大核心 2024年第8期68-75,共8页
标记语言翻译相比于纯文本类型翻译任务来说,存在标记格式复杂多样造成的译文质量低和译文端格式难以保持等技术难题。针对这些难题,该文提出基于组合泛化的标记语言建模方法。同时,针对标记语言的格式还原问题,该文提出使用标签位置准... 标记语言翻译相比于纯文本类型翻译任务来说,存在标记格式复杂多样造成的译文质量低和译文端格式难以保持等技术难题。针对这些难题,该文提出基于组合泛化的标记语言建模方法。同时,针对标记语言的格式还原问题,该文提出使用标签位置准确率、正确率、召回率和F_(1)值等指标来衡量标记语言格式还原效果。实验发现,该文所提出的泛化方法相较于基于截断、基于词对齐和已有的泛化方法,BLEU均有较大提升,格式还原率接近100%。 展开更多
关键词 标记语言 机器翻译 基于泛化的建模方法
在线阅读 下载PDF
利用统计搭配模型改进基于实例的机器翻译 被引量:12
4
作者 刘占一 李生 +1 位作者 刘挺 王海峰 《软件学报》 EI CSCD 北大核心 2012年第6期1472-1485,共14页
基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配... 基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3个方面提高EBMT的性能:(1)利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2)通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3)使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU得分提高了4.73~6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU得分提高了1.82个百分点.同时,人工评价结果显示,改进后的半结构化EBMT系统的译文能够表达原文的大部分信息,并且具有较高的流利度. 展开更多
关键词 统计搭配模型 基于实例的机器翻译 实例选择 译文选择
在线阅读 下载PDF
一种混合式机器翻译方法及其算法 被引量:6
5
作者 杨宪泽 谈文蓉 +1 位作者 唐向阳 秦沿海 《计算机应用与软件》 CSCD 北大核心 2005年第9期142-144,F0003,共4页
在机器翻译的研究中,混合式方法是一种好方法。本文的工作有:第一,讨论完全实例的机器翻译,提出了直接散列检索算法;第二,讨论句型转换的机器翻译;第三,讨论近似机器翻译。
关键词 机器翻译 完全实例 句型转换 近似翻译 机器翻译方法 检索算法 混合式 散列
在线阅读 下载PDF
基于实例的汉蒙机器翻译 被引量:16
6
作者 侯宏旭 刘群 那顺乌日图 《中文信息学报》 CSCD 北大核心 2007年第4期65-72,共8页
本文通过对汉蒙机器翻译方法的研究,给出了一种基于实例的汉蒙机器翻译方法,并加以了实现。本文给出了用于汉蒙EBMT机器翻译的实例搜索以及短语片段划分、匹配、组合的方法。本文给出的方法是基于词语对齐的,利用词语对齐进行词语的匹配... 本文通过对汉蒙机器翻译方法的研究,给出了一种基于实例的汉蒙机器翻译方法,并加以了实现。本文给出了用于汉蒙EBMT机器翻译的实例搜索以及短语片段划分、匹配、组合的方法。本文给出的方法是基于词语对齐的,利用词语对齐进行词语的匹配,并根据匹配词数和长度计算相似度,选取最好的实例。通过对齐信息,确定片段组合的策略,生成翻译结果。通过对方法的实现和实验,完成了一个基于实例的汉蒙机器翻译系统。 展开更多
关键词 人工智能 机器翻译 蒙古语 基于实例 词语对齐
在线阅读 下载PDF
统计机器翻译中实例短语对研究 被引量:3
7
作者 李强 李沐 +1 位作者 张冬冬 朱靖波 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第1期113-119,共7页
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻... 针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上,与基线系统相比,该方法在多个测试集上明显提高了翻译系统的翻译质量,在部分测试集上BLEU值可提高1%左右。 展开更多
关键词 统计机器翻译 基于短语 基于实例 短语对
在线阅读 下载PDF
一种基于实例的汉英机器翻译策略 被引量:5
8
作者 胡国全 陈家骏 +1 位作者 戴新宇 尹存燕 《计算机工程与设计》 CSCD 北大核心 2005年第4期900-903,906,共5页
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也... 介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。 展开更多
关键词 自然语言处理 机器翻译 实例 EBMT技术
在线阅读 下载PDF
基于实例的汉英机器翻译系统研究与实现 被引量:14
9
作者 王长胜 刘群 《计算机工程与应用》 CSCD 北大核心 2002年第8期126-127,135,共3页
文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、... 文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、翻译结果的正确率等方面取得了令人满意的结果。 展开更多
关键词 汉英机器翻译系统 实例 双语语料库 计算机
在线阅读 下载PDF
维吾尔语机器翻译研究综述 被引量:2
10
作者 哈里旦木·阿布都克里木 侯钰涛 +2 位作者 姚登峰 阿布都克力木·阿布力孜 陈吉尚 《计算机工程》 CSCD 北大核心 2024年第1期1-16,共16页
维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语... 维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语机器翻译发展的不同阶段,研究人员针对其特点在算法和模型上不断优化与创新,取得了一定的研究成果,但缺乏系统性的综述。全面回顾维吾尔语机器翻译的相关研究,并根据方法的不同将其分为基于规则和实例的维吾尔语机器翻译、基于统计的维吾尔语机器翻译以及基于神经网络的维吾尔语机器翻译3种类型,同时对相关学术活动和语料库资源进行汇总。为进一步探索维吾尔语机器翻译的潜力,采用ChatGPT模型对维吾尔语-汉语机器翻译任务进行初步研究,实验结果表明,在Few-shot情景下,随着示例数的增加,翻译性能先升后降,在10-shot时表现最佳。此外,思维链方法在维吾尔语机器翻译任务中并未展示出更优的翻译能力。最后对维吾尔语机器翻译未来的研究方向进行了展望。 展开更多
关键词 维吾尔语 基于规则和实例的机器翻译 统计机器翻译 神经机器翻译 大语言模型
在线阅读 下载PDF
一种混合式机器翻译方法的分析研究 被引量:9
11
作者 杨宪泽 肖明 《计算机工程与科学》 CSCD 北大核心 2012年第2期168-171,共4页
在机器翻译的研究中,混合式方法是一种好方法。本文的工作有两部分:第一部分提出新的句型转换的机器翻译方法;第二部分讨论近似机器翻译方法的改进,并对对齐处理、相似度计算和检索方法做了详细说明。
关键词 机器翻译 改进方法 句型转换 近似算法
在线阅读 下载PDF
多策略机器翻译系统IHSMTS中实例模式泛化匹配算法 被引量:1
12
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 胡春玲 《中文信息学报》 CSCD 北大核心 2005年第4期1-9,共9页
基于精确匹配的EBMT,由于翻译覆盖率过低,导致其难以大规模实际应用。本文提出一种实例模式泛化匹配算法,试图改善EBMT的翻译覆盖率:以输入的待翻译句子为目标导向,对候选翻译实例有针对性地进行实时泛化,使得算法既能满足实时文档翻译... 基于精确匹配的EBMT,由于翻译覆盖率过低,导致其难以大规模实际应用。本文提出一种实例模式泛化匹配算法,试图改善EBMT的翻译覆盖率:以输入的待翻译句子为目标导向,对候选翻译实例有针对性地进行实时泛化,使得算法既能满足实时文档翻译对速度的要求,又能充分利用系统使用过程中用户新添加和修改的翻译知识,从而总体上提高了系统的翻译覆盖率和翻译质量。实验结果表明,在语料规模为16万句对的情况下,系统翻译覆盖率达到了75%左右,充分说明了本文算法的有效性。 展开更多
关键词 人工智能 机器翻译 基于实例的机器翻译 泛化匹配 翻译覆盖率
在线阅读 下载PDF
基于句法的统计机器翻译模型与方法 被引量:17
13
作者 刘群 《中文信息学报》 CSCD 北大核心 2011年第6期63-71,共9页
该文总结了我们近几年来在基于句法的统计机器翻译方面所做的研究工作,特别是基于源语言句法的一系列统计机器翻译模型与方法,具体包括:基于最大熵括号转录语法的翻译模型,基于源语言短语结构树的树到串翻译模型及其相应的基于树的翻译... 该文总结了我们近几年来在基于句法的统计机器翻译方面所做的研究工作,特别是基于源语言句法的一系列统计机器翻译模型与方法,具体包括:基于最大熵括号转录语法的翻译模型,基于源语言短语结构树的树到串翻译模型及其相应的基于树的翻译方法,基于森林的翻译方法和句法分析与解码一体化翻译方法,基于源语言依存树的翻译模型。 展开更多
关键词 统计机器翻译 基于句法的翻译模型 基于句法的翻译方法
在线阅读 下载PDF
基于UAMRT的机器翻译方法
14
作者 李玉鉴 《计算机科学》 CSCD 北大核心 2004年第5期172-175,共4页
本文提出了一种新的机器翻译方法,即基于UAMRT的机器翻译。该方法的基本思想非常简单:首先设计模板匹配替换通用算法UAMRT,然后利用UAMRT匹配句子中的源语言模板,并将其替换为相应的目标语言模板,从而实现对句子的翻译。在结合句型分析... 本文提出了一种新的机器翻译方法,即基于UAMRT的机器翻译。该方法的基本思想非常简单:首先设计模板匹配替换通用算法UAMRT,然后利用UAMRT匹配句子中的源语言模板,并将其替换为相应的目标语言模板,从而实现对句子的翻译。在结合句型分析算法和从句分析算法的基础上,利用启发式搜索机制进一步提高了句子的翻译速度和质量。速度测试表明用该方法实现的英汉翻译系统在P-IV1.7G的计算机上翻译速度每秒可以达到1300个单词左右;质量测试表明该系统的性能在开发过程中仅仅通过增加更多的模板就会变得越来越好,而且在应用时与几种商用系统相比可以达到中等水平。 展开更多
关键词 UAMRT 机器翻译方法 模板匹配替换通用算法 句型分析 从句分析 启发式搜索
在线阅读 下载PDF
多策略机器翻译系统IHSMTS中候选实例模式检索算法 被引量:2
15
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 代六玲 《小型微型计算机系统》 CSCD 北大核心 2005年第3期330-334,共5页
基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是... 基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是EBMT系统所必须解决的一大难题.文章基于句子的词表层特征和信息熵提出了一种多层次候选实例模式检索算法,通过在多策略机器翻译系统IHSMTS上的运行测试,结果表明该算法较好的解决了这一难题. 展开更多
关键词 基于实例的机器翻译 实例模式库 候选实例 词表层特征 信息熵
在线阅读 下载PDF
OpenE:一种基于n-gram共现的自动机器翻译评测方法 被引量:8
16
作者 孙连恒 杨莹 姚天顺 《中文信息学报》 CSCD 北大核心 2004年第2期15-22,共8页
在机器翻译研究领域中 ,评测工作发挥着重要的作用 ,它不仅仅是简单地对各个系统输出结果进行比较 ,它还对关键技术的发展起到了促进作用。译文质量的评测工作长期以来一直以人工的方式进行。随着机器翻译研究发展的需要 ,自动的译文评... 在机器翻译研究领域中 ,评测工作发挥着重要的作用 ,它不仅仅是简单地对各个系统输出结果进行比较 ,它还对关键技术的发展起到了促进作用。译文质量的评测工作长期以来一直以人工的方式进行。随着机器翻译研究发展的需要 ,自动的译文评测研究已经成为机器翻译研究中的一个重要课题。本文讨论了基于n gram共现的自动机器翻译评测框架 ,介绍了BLEU、NIST、OpenE三种自动评价方法 ,并通过实验详细分析了三种方法的优缺点。其中的OpenE采用了本文提出了一种新的片断信息量计算方法。它有效地利用了一个局部语料库 (参考译文库 )和全局语料库 (目标语句子库 )。实验结果表明这种方法对于机器翻译评价来说是比较有效的。 展开更多
关键词 人工智能 机器翻译 评测方法 信息量计算 n-gram共现 OpenE
在线阅读 下载PDF
面向神经机器翻译的枢轴方法研究综述 被引量:1
17
作者 黎家全 王丽清 +2 位作者 李鹏 蒋晓敏 徐永跃 《计算机工程与应用》 CSCD 北大核心 2022年第16期49-55,共7页
低资源语言的神经机器翻译(neural machine translation,NMT)一直是机器翻译领域研究的难点和热点,基于枢轴的方法为其性能的提升和改进提供了思路。针对枢轴思想在低资源语言神经机器翻译中的应用,从枢轴翻译、基于枢轴的伪平行数据生... 低资源语言的神经机器翻译(neural machine translation,NMT)一直是机器翻译领域研究的难点和热点,基于枢轴的方法为其性能的提升和改进提供了思路。针对枢轴思想在低资源语言神经机器翻译中的应用,从枢轴翻译、基于枢轴的伪平行数据生成和基于枢轴的模型构建三方面,对不同方法的国内外研究现状、主要问题和趋势进行了分析和比较,为该领域的研究提供参考和借鉴。 展开更多
关键词 枢轴方法 神经机器翻译(NMT) 低资源机器翻译
在线阅读 下载PDF
机器翻译方法研究与发展综述 被引量:27
18
作者 侯强 侯瑞丽 《计算机工程与应用》 CSCD 北大核心 2019年第10期30-35,66,共7页
简要述评了机器翻译方法,依据知识处理方式,将其划分为三类,分别为规则法、语料库法、混合法,对比了其优劣所在。捕捉了当前机器翻译主流构建方式,基于注意力的神经网络法,其最新动态主要包括降低计算复杂度,提高词对齐质量,融入先验与... 简要述评了机器翻译方法,依据知识处理方式,将其划分为三类,分别为规则法、语料库法、混合法,对比了其优劣所在。捕捉了当前机器翻译主流构建方式,基于注意力的神经网络法,其最新动态主要包括降低计算复杂度,提高词对齐质量,融入先验与约束,改善历史记忆力。基于上述考察指明未来机器翻译方法的发展趋势,具体包括网络融合逐步深化,处理方式走向并行,训练方法日趋多样。 展开更多
关键词 机器翻译 机器翻译方法 语料库法 神经网络法
在线阅读 下载PDF
基于语种相似性挖掘的神经机器翻译语料库扩充方法
19
作者 李灿 杨雅婷 +1 位作者 马玉鹏 董瑞 《计算机应用》 CSCD 北大核心 2021年第11期3145-3150,共6页
针对低资源语言机器翻译任务上一直存在的标注数据资源匮乏问题,提出了基于语种相似性挖掘的神经机器翻译语料库扩充方法。首先,将维吾尔语和哈萨克语作为相似语言对并将其语料进行混合;然后,对混合后的语料分别进行字节对编码(BPE)处... 针对低资源语言机器翻译任务上一直存在的标注数据资源匮乏问题,提出了基于语种相似性挖掘的神经机器翻译语料库扩充方法。首先,将维吾尔语和哈萨克语作为相似语言对并将其语料进行混合;然后,对混合后的语料分别进行字节对编码(BPE)处理、音节切分处理以及基于音节切分的BPE处理,从而深度挖掘哈语和维语的相似性;最后,引入“开始-中部-结束(BME)”序列标注方法对语料中已切分完成的音节进行标注,以消除音节输入所带来的一些歧义。在CWMT2015维汉平行语料和哈汉平行语料上的实验结果表明,所提方法相较于不进行特殊语料处理以及BPE语料处理训练所得普通模型在维吾尔语-汉语翻译上的双语评估替补(BLEU)值分别提升了9.66、4.55,在哈萨克语-汉语翻译上的BLEU值分别提升了9.44、4.36。所提方案实现了维语和哈语到汉语的跨语言神经机器翻译,提升了维吾尔语-汉语和哈萨克语-汉语机器翻译的翻译质量,可应用于维语和哈语的语料处理。 展开更多
关键词 相似语种 语料扩充 机器翻译 字节对编码 音节切分 基于音节切分的字节对编码 “开始-中部-结束”序列标注方法
在线阅读 下载PDF
多策略汉日机器翻译系统中的核心技术研究 被引量:4
20
作者 杜伟 陈群秀 《中文信息学报》 CSCD 北大核心 2008年第5期60-66,共7页
多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于... 多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。 展开更多
关键词 人工智能 机器翻译 汉日机器翻译系统 汉语分析 翻译记忆技术 基于实例的机器翻译方法 基于配价的 机器翻译方法
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部