期刊文献+
共找到170篇文章
< 1 2 9 >
每页显示 20 50 100
基于短语的统计机器翻译中短语抽取算法改进 被引量:3
1
作者 强静 张建 《计算机工程与应用》 CSCD 北大核心 2008年第13期147-149,共3页
针对基于短语统计机器翻译中目前常用的Och提出的短语抽取算法,提出了一种改进算法。该算法能够在原有算法的基础上抽取出更多的准确对齐信息,这对语料库较小的汉民统计机器来说意义重大,增加正确的对齐信息可以减少未登录词的产生,提... 针对基于短语统计机器翻译中目前常用的Och提出的短语抽取算法,提出了一种改进算法。该算法能够在原有算法的基础上抽取出更多的准确对齐信息,这对语料库较小的汉民统计机器来说意义重大,增加正确的对齐信息可以减少未登录词的产生,提高翻译正确率。经过对不同规模语料库的实验,抽取的短语对数目有明显增多。 展开更多
关键词 统计机器翻译 翻译模型 短语抽取
在线阅读 下载PDF
基于短语的统计机器翻译中短语表的过滤 被引量:1
2
作者 狄萍 周宥良 +1 位作者 贡正仙 周国栋 《计算机应用与软件》 CSCD 2011年第5期28-30,41,共4页
大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的... 大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的情况下,短语表可以缩减为原来的78%。并且当短语表缩减为原来的47.5%时,BLEU评价仍提高了0.0158。 展开更多
关键词 统计机器翻译 短语表过滤 C-VALUE 短语粘结度
在线阅读 下载PDF
基于短语相似度的统计机器翻译模型 被引量:3
3
作者 何中军 刘群 林守勋 《高技术通讯》 EI CAS CSCD 北大核心 2009年第4期337-341,共5页
针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源... 针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译。与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题。实验表明,该模型能够明显地提高统计机器翻译的质量,效果超过了当前最好的短语系统'摩西(Moses)'。 展开更多
关键词 相似度 基于短语的统计机器翻译 基于实例的机器翻译
在线阅读 下载PDF
基于虚拟上下文的统计机器翻译短语表的过滤 被引量:1
4
作者 殷乐 张玉洁 徐金安 《中文信息学报》 CSCD 北大核心 2013年第6期139-143,共5页
在基于短语的统计机器翻译系统中,自动抽取的短语表中不可避免的包含大量的冗余和错误的短语对,这浪费了解码资源又影响翻译质量。为了缓解这个问题,该文提出一种基于虚拟上下文的过滤短语表的方法。该方法引入虚拟上下文计算短语对的... 在基于短语的统计机器翻译系统中,自动抽取的短语表中不可避免的包含大量的冗余和错误的短语对,这浪费了解码资源又影响翻译质量。为了缓解这个问题,该文提出一种基于虚拟上下文的过滤短语表的方法。该方法引入虚拟上下文计算短语对的得分增量;并通过计算最大和最小的短语对的得分增量,设计了一种对短语对重排序的过滤策略。我们在NTCIR-9的中英数据上进行了验证实验,结果显示,当短语表的规模下降到原来的47%时,翻译质量的BLEU值提高了0.000 5;当短语表的规模下降到原来的30%时,BLEU值仅下降0.000 6。实验结果表明,在大规模短语表的过滤中,该文的方法是有效可行的。 展开更多
关键词 基于短语的统计机器翻译 短语表过滤 虚拟上下文
在线阅读 下载PDF
统计机器翻译中实例短语对研究 被引量:3
5
作者 李强 李沐 +1 位作者 张冬冬 朱靖波 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第1期113-119,共7页
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻... 针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题,在基于短语的统计机器翻译系统中,通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作,生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上,与基线系统相比,该方法在多个测试集上明显提高了翻译系统的翻译质量,在部分测试集上BLEU值可提高1%左右。 展开更多
关键词 统计机器翻译 基于短语 基于实例 短语
在线阅读 下载PDF
利用句法短语改善统计机器翻译性能 被引量:5
6
作者 孙水华 丁鹏 黄德根 《中文信息学报》 CSCD 北大核心 2015年第2期95-102,共8页
短语表是基于短语的统计机器翻译系统的一个核心组成部分,基于启发式方法抽取到的短语表受单词对齐错误和未对齐词的影响严重,同时抽取到的短语也并非句法意义上的短语。该文提出一种基于EM(Expectation-maximization)算法的双语句法短... 短语表是基于短语的统计机器翻译系统的一个核心组成部分,基于启发式方法抽取到的短语表受单词对齐错误和未对齐词的影响严重,同时抽取到的短语也并非句法意义上的短语。该文提出一种基于EM(Expectation-maximization)算法的双语句法短语抽取方法来抽取双语句法短语,此方法可以通过不断迭代的方式使各参数值达到最优。通过加入双语句法短语、增加新特征、重新训练三种不同的方法,将获得的双语句法短语与基于短语的统计机器翻译方法结合以提高统计机器翻译系统的性能。结果表明:三种方法都不同程度提高了译文的BLEU(BiLingual Evaluation Understudy)值,其中增加新特征方法提高了0.64个点。 展开更多
关键词 统计机器翻译 EM算法 双语句法短语
在线阅读 下载PDF
统计机器翻译中短语切分的新方法 被引量:3
7
作者 何中军 刘群 林守勋 《中文信息学报》 CSCD 北大核心 2007年第1期85-89,共5页
基于短语的统计机器翻译是目前主流的一种统计机器翻译方法,但是目前基于短语的翻译系统都没有对短语切分作专门处理,认为一个句子的所有短语切分都是等概率的。本文提出了一种短语切分方法,将句子的短语切分概率化:首先,识别出汉语语... 基于短语的统计机器翻译是目前主流的一种统计机器翻译方法,但是目前基于短语的翻译系统都没有对短语切分作专门处理,认为一个句子的所有短语切分都是等概率的。本文提出了一种短语切分方法,将句子的短语切分概率化:首先,识别出汉语语料库中所有出现次数大于2次的词语串,将其作为汉语短语;其次,用最短路径方法进行短语切分,并利用Viterbi算法迭代统计短语的出现频率。在2005年863汉英机器翻译评测测试集上的实验结果(BLEU4)是:0.1764(篇章),0.2231(对话)。实验表明,对于长句子(如篇章),短语切分模型的加入有助于提高翻译质量,比原来约提高了0.5个百分点。 展开更多
关键词 人工智能 机器翻译 统计机器翻译 翻译模型 短语切分
在线阅读 下载PDF
统计机器翻译中的非连续短语模板抽取及其应用 被引量:2
8
作者 孙越恒 段楠 侯越先 《计算机科学》 CSCD 北大核心 2009年第10期192-196,共5页
目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失。以非连续介词短语为例,提供了一种短语模板抽取算法。首先采用基于规则的方法,抽取出中文非连续介词短语模板,而后借助... 目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失。以非连续介词短语为例,提供了一种短语模板抽取算法。首先采用基于规则的方法,抽取出中文非连续介词短语模板,而后借助双语对齐语料和介词_方位词翻译表,获得模板对应的英文翻译。最终形成的双语模板被加入短语翻译表中。在标准测试语料上的对比实验表明,加入非连续短语模板后,译文更加符合语法规范,而翻译结果也取得了相对稳定的提高。 展开更多
关键词 统计机器翻译 短语模板 非连续介词短语 模板抽取
在线阅读 下载PDF
基于短语统计机器翻译模型蒙古文形态切分 被引量:4
9
作者 李文 李淼 +3 位作者 梁青 朱海 应玉龙 乌达巴拉 《中文信息学报》 CSCD 北大核心 2011年第4期122-128,共7页
该文结合最小上下文构成代价模型,借鉴并利用统计机器翻译的方法,尝试解决蒙古文形态切分问题。基于短语的统计机器翻译形态蒙文切分模型和最小上下文构成代价模型分别对词表词和未登录词进行形态切分。前者选取了短语机器翻译系统中三... 该文结合最小上下文构成代价模型,借鉴并利用统计机器翻译的方法,尝试解决蒙古文形态切分问题。基于短语的统计机器翻译形态蒙文切分模型和最小上下文构成代价模型分别对词表词和未登录词进行形态切分。前者选取了短语机器翻译系统中三个常用的模型,包括短语翻译模型、词汇化翻译模型和语言模型,最小上下文构成代价模型考虑了一元词素上下文环境和词缀N-gram上下文环境。实验结果显示:基于短语统计机器翻译形态切分模型对词表词切分,最小上下文构成代价模型对未登录词处理后,总体的切分准确率达到96.94%。此外,词素融入机器翻译系统中后,译文质量有了显著的提高,更进一步的证实了本方法的有效性和实用性。 展开更多
关键词 形态学 形态切分 机器翻译 统计模型
在线阅读 下载PDF
短语统计机器翻译的句法调序模型 被引量:6
10
作者 薛永增 李生 +1 位作者 赵铁军 杨沐昀 《通信学报》 EI CSCD 北大核心 2008年第1期7-14,共8页
为了处理统计机器翻译中的长距离调序,在基于短语的统计翻译模型的基础上提出了句法调序模型。该模型按照短语切分来分割句法树结构,从而能够避免短语和句法结构的不一致性。在该模型中依据短语对齐和短语内词对齐确定句法树部分结构的... 为了处理统计机器翻译中的长距离调序,在基于短语的统计翻译模型的基础上提出了句法调序模型。该模型按照短语切分来分割句法树结构,从而能够避免短语和句法结构的不一致性。在该模型中依据短语对齐和短语内词对齐确定句法树部分结构的调序顺序,依据各个节点上的调序概率计算子结构的调序概率,作为对数线性模型的特征函数。该模型的实验结果比经典的短语统计翻译模型的BLEU评分有明显提高。结果表明句法调序模型对于基于短语的统计机器翻译是有效的,能够较好地将句法知识和短语翻译过程结合起来。 展开更多
关键词 人工智能 统计翻译模型 句法调序 短语
在线阅读 下载PDF
基于短语统计翻译的汉维机器翻译系统 被引量:5
11
作者 杨攀 李淼 张建 《计算机应用》 CSCD 北大核心 2009年第7期2022-2025,共4页
描述了一种基于短语统计翻译的汉维机器翻译系统。首先使用汉维语料进行训练,得到语言模型和翻译模型;再利用训练好的模型对源语句进行解码,以得到最佳的翻译语句。解码的核心算法是柱搜索(beam search)算法。其中维文语料使用的是拉丁... 描述了一种基于短语统计翻译的汉维机器翻译系统。首先使用汉维语料进行训练,得到语言模型和翻译模型;再利用训练好的模型对源语句进行解码,以得到最佳的翻译语句。解码的核心算法是柱搜索(beam search)算法。其中维文语料使用的是拉丁维文。实验结果表明,基于短语的统计机器翻译方法可以快速有效地构建一个汉维机器翻译平台。 展开更多
关键词 短语统计翻译 语言模型 翻译模型 柱搜索算法
在线阅读 下载PDF
一种基于短语的汉蒙统计机器翻译与调序模型 被引量:3
12
作者 侯宏旭 刘群 李锦涛 《高技术通讯》 EI CAS CSCD 北大核心 2009年第5期475-479,共5页
根据蒙古语的一些特点,为基于短语的汉蒙统计机器翻译提出了一种适合于汉蒙统计机器翻译的调序模型,并给出了相应的训练和解码算法以及初步实验的结果。汉蒙双语语料库规模很小,数据稀疏问题严重,而在汉蒙翻译中,词序变化又非常明显,在... 根据蒙古语的一些特点,为基于短语的汉蒙统计机器翻译提出了一种适合于汉蒙统计机器翻译的调序模型,并给出了相应的训练和解码算法以及初步实验的结果。汉蒙双语语料库规模很小,数据稀疏问题严重,而在汉蒙翻译中,词序变化又非常明显,在汉英等机器翻译中使用的调序方法难于应用到汉蒙统计机器翻译中。通过对汉蒙翻译过程中词语顺序变化的正态分布假设,建立了一种概率调序模型。实验表明,这种概率调序模型好于 Moses系统中采用的调序方法。 展开更多
关键词 机器翻译 统计方法 蒙古语 调序 概率
在线阅读 下载PDF
基于短语和句法的统计机器翻译 被引量:20
13
作者 冯志伟 《燕山大学学报》 CAS 北大核心 2015年第6期546-554,560,共10页
回顾了统计机器翻译发展的历程,讨论了噪声信道模型、基于短语的统计机器翻译和基于句法的统计机器翻译,主张把理性主义方法和经验主义方法结合起来,以推进机器翻译的进一步发展。
关键词 机器翻译 统计机器翻译 噪声信道模型 理性主义方法 经验主义方法
在线阅读 下载PDF
基于短语统计机器翻译解码算法的研究与实现 被引量:1
14
作者 罗毅 李淼 +1 位作者 朱鉴 胡冠龙 《计算机工程与应用》 CSCD 北大核心 2007年第30期171-173,178,共4页
解码器是统计机器翻译研究的关键部分。在基于短语的统计机器翻译的基础上,结合对数线性模型的思想加入多个特征模型,研究了一种动态规划的柱搜索解码算法。详细介绍此算法在解码器中的具体实现,并对翻译速度和精度作了分析。
关键词 统计机器翻译 解码算法 柱搜索 特征模型
在线阅读 下载PDF
基于短语模板对齐的统计机器翻译系统 被引量:1
15
作者 杨振东 庞薇 +3 位作者 魏玮 杜金华 陈振标 宗成庆 《中文信息学报》 CSCD 北大核心 2006年第B03期53-60,共8页
论文提出了一种基于短语模板时齐的机器翻译系统。系统采用基于短语模板对齐的翻译模型替代原始基于词的模型,提出了计算短语模板翻译概率的方法,改进了先前单纯基于短语的搜索算法和回溯方法。解码时引入繁衍度为0且出现频率高的词... 论文提出了一种基于短语模板时齐的机器翻译系统。系统采用基于短语模板对齐的翻译模型替代原始基于词的模型,提出了计算短语模板翻译概率的方法,改进了先前单纯基于短语的搜索算法和回溯方法。解码时引入繁衍度为0且出现频率高的词,使翻译结果更合理。论文进行了一系列实验,介绍了05年863评洲,证明本系统翻译结果的Bleu得分比原来的系统有了显著提高。 展开更多
关键词 统计机器翻译 翻译模型 搜索算法
在线阅读 下载PDF
一种基于短语统计机器翻译的高效柱搜索解码器
16
作者 罗毅 李淼 张建 《计算机应用》 CSCD 北大核心 2007年第8期1973-1975,共3页
描述了一种基于短语统计机器翻译的柱搜索解码器。搜索算法的效率是解码的关键,基于传统的柱搜索解码算法,提出了提高搜索效率的改进措施:动态剪枝策略改进了原来固定地剪枝对搜索当前情形反应不足的问题,提高了剪枝精度;预剪枝策略限... 描述了一种基于短语统计机器翻译的柱搜索解码器。搜索算法的效率是解码的关键,基于传统的柱搜索解码算法,提出了提高搜索效率的改进措施:动态剪枝策略改进了原来固定地剪枝对搜索当前情形反应不足的问题,提高了剪枝精度;预剪枝策略限制了较差的扩展,减少了不必要的扩展,提高了搜索速度;在研究了当前主要位置重排限制的基础上,提出了一种快速位置重排限制策略,加快了位置重排时的解码速度。此外,针对领域术语翻译唯一性问题提出了专门处理方法以提高翻译的准确度。分析对比实验结果,证明了算法的有效性。 展开更多
关键词 统计机器翻译 解码器 柱搜索 动态剪枝 位置重排限制
在线阅读 下载PDF
基于短语的汉蒙统计机器翻译研究 被引量:6
17
作者 王斯日古楞 斯琴图 那顺乌日图 《计算机工程与应用》 CSCD 北大核心 2010年第14期138-142,共5页
基于短语的统计机器翻译是当前统计机器翻译的主流方法。研究了利用现有技术和资源搭建一个基于短语的汉蒙机器翻译系统的方法,并且构建了一个汉蒙机器翻译的自动评价平台,在此基础上利用词典和蒙古语形态学信息来提高了翻译系统的性能。
关键词 短语 汉蒙统计机器翻译 自动评测 形态学
在线阅读 下载PDF
一种融合句法短语的汉英统计机器翻译方法 被引量:6
18
作者 宋鼎新 黄德根 《小型微型计算机系统》 CSCD 北大核心 2017年第10期2197-2201,共5页
基于短语的统计机器翻译所使用的短语并不限制句法边界,因而得到的翻译结果存在大量不符合句法结构的表达.为此,分析短语模型与句法模型各自的优势与不足,提出将句法分析结果中获得的双语句法短语对融入在短语模型中,以改善机器翻译质量... 基于短语的统计机器翻译所使用的短语并不限制句法边界,因而得到的翻译结果存在大量不符合句法结构的表达.为此,分析短语模型与句法模型各自的优势与不足,提出将句法分析结果中获得的双语句法短语对融入在短语模型中,以改善机器翻译质量.首先对平行语料分别进行句法分析并从中获取中英文单语句法短语,而后利用短语表与一致性短语原则获取双语句法短语对,最后将其与短语翻译模型的原有短语表相结合.实验结果表明:双语句法短语能够提高基于短语的统计机器翻译质量,在十万句对与百万句对规模双语平行训练语料中BLEU值分别提高0.56%与0.62%. 展开更多
关键词 统计机器翻译 双语句法短语 短语翻译模型 短语
在线阅读 下载PDF
对齐模板在标准短语统计机器翻译模型中的应用 被引量:2
19
作者 张步峰 孙越恒 赵青 《电子测量技术》 2007年第7期146-149,161,共5页
在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够... 在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够较好处理数据稀疏的问题,短语对可以使翻译更加精确。本文提出在基于最大熵的标准短语翻译模型下模拟对齐模板,模拟的对齐模板被作为一个单独的特征函数加入到此翻译模型中。实验在中英翻译和法英翻译上进行,实验结果证明,本文方法明显改善了标准短语翻译模型的翻译效果。 展开更多
关键词 统计机器翻译 标准短语翻译模型 对齐模板 最大熵模型
在线阅读 下载PDF
融入双语最大名词短语的机器翻译模型 被引量:9
20
作者 李业刚 梁丽君 +2 位作者 孙福振 王绍卿 于潇 《计算机应用研究》 CSCD 北大核心 2017年第5期1316-1320,共5页
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略... 在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。 展开更多
关键词 统计机器翻译 短语翻译模型 最大名词短语 双语最大名词短语
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部