期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
融入双语最大名词短语的机器翻译模型 被引量:9
1
作者 李业刚 梁丽君 +2 位作者 孙福振 王绍卿 于潇 《计算机应用研究》 CSCD 北大核心 2017年第5期1316-1320,共5页
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略... 在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。 展开更多
关键词 统计机器翻译 短语翻译模型 最大名词短语 双语最大名词短语
在线阅读 下载PDF
一种面向社区型问句检索的主题翻译模型 被引量:7
2
作者 张伟男 张宇 刘挺 《计算机学报》 EI CSCD 北大核心 2015年第2期313-321,共9页
基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该... 基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型. 展开更多
关键词 社区型问答 问句检索 主题模型 翻译模型 LDA(Latent DIRICHLET Allocation) 社会计算 社交网络
在线阅读 下载PDF
汉蒙翻译模型中的依存语法与形态信息应用研究 被引量:5
3
作者 骆凯 李淼 +2 位作者 乌达巴拉 杨攀 朱海 《中文信息学报》 CSCD 北大核心 2009年第6期98-104,共7页
该文提出将源语言句法信息和目标语言形态信息引入汉蒙机器翻译的模型构造中,以降低译文的词形错误率等问题。在源语言端,利用汉语依存句法分析器获取依存树,将依存句法信息以标注形式记在每个词上;在目标语言端,分析并获取蒙古语形态信... 该文提出将源语言句法信息和目标语言形态信息引入汉蒙机器翻译的模型构造中,以降低译文的词形错误率等问题。在源语言端,利用汉语依存句法分析器获取依存树,将依存句法信息以标注形式记在每个词上;在目标语言端,分析并获取蒙古语形态信息;利用LOP思想将源语言依存句法信息和目标语言形态信息引入翻译模型构造中。实验表明,其BLEU评分比传统的短语统计翻译模型有明显提高。该方法通过词、短语、句法三层面信息的结合,实现了汉蒙两种语言语法结构的平衡,特别适合于源语言形态信息贫乏而目标语言形态信息丰富的统计机器翻译系统。 展开更多
关键词 人工智能 机器翻译 依存语法 形态信息 汉蒙翻译模型 LOP-Factored模型 统计机器翻译
在线阅读 下载PDF
面向篇章机器翻译的英汉翻译单位和翻译模型研究 被引量:15
4
作者 宋柔 葛诗利 《中文信息学报》 CSCD 北大核心 2015年第5期125-135,共11页
篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译... 篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译、装配三步模型(PTA模型)。该文提出,汉语篇章机器翻译的复合单位为广义话题结构对应的文本块,基本单位则是根据广义话题结构流水模型得到的话题自足句;英语篇章机器翻译的复合单位为句号句,基本单位为naming-telling小句(NT小句),即指称性成分加上对它的陈述或后修饰成分所构成的小句。该文展示了在这样的翻译单位体系下采用PTA模型的英汉翻译过程实例,规划了面向篇章翻译的英汉小句对齐语料库的建设任务,讨论了PTA模型的可行性。 展开更多
关键词 翻译单位 翻译模型 广义话题结构 naming-telling小句
在线阅读 下载PDF
利用平行网页建立中英文统计翻译模型 被引量:9
5
作者 聂建云 陈江 《中文信息学报》 CSCD 北大核心 2001年第1期1-12,共12页
建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构... 建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构信息。实验表明 ,所训练的翻译模型能达到 80 %的准确率。对于象跨语言信息检索这样的应用 ,这样的准确率已经能大致满足需要。这一工作表明 。 展开更多
关键词 中英问句翻译 句对齐 统计翻译模型 跨语言信息检索 平行文本 HTML结构 准确率
在线阅读 下载PDF
基于翻译模型和语言模型相融合的双语句对选择方法 被引量:2
6
作者 姚亮 洪宇 +2 位作者 刘昊 刘乐 姚建民 《中文信息学报》 CSCD 北大核心 2016年第5期145-152,共8页
双语句对选择方法旨在从大规模通用领域双语语料库中,自动抽取与待翻译文本领域相关性较高的句对,以缓解特定领域翻译模型训练语料不足的问题。区别于原有基于语言模型的双语句对选择方法,该文从句对生成式建模的角度出发,提出一种基于... 双语句对选择方法旨在从大规模通用领域双语语料库中,自动抽取与待翻译文本领域相关性较高的句对,以缓解特定领域翻译模型训练语料不足的问题。区别于原有基于语言模型的双语句对选择方法,该文从句对生成式建模的角度出发,提出一种基于翻译模型和语言模型相融合的双语句对选择方法。该方法能够有效评价双语句对的领域相关性及互译性。实验结果显示,利用该文所提方法选择双语句对训练所得翻译系统,相比于基准系统,在测试集上性能提升3.5个BLEU值;此外,针对不同句对质量评价特征之间的权重调节问题,该文提出一种基于句对重排序的特征权重自动优化方法。基于该方法的机器翻译系统性能继续提升0.68个BLEU值。 展开更多
关键词 双语句对选择 生成式建模 翻译模型 语言模型 权重调节
在线阅读 下载PDF
基于句法的统计机器翻译模型与方法 被引量:17
7
作者 刘群 《中文信息学报》 CSCD 北大核心 2011年第6期63-71,共9页
该文总结了我们近几年来在基于句法的统计机器翻译方面所做的研究工作,特别是基于源语言句法的一系列统计机器翻译模型与方法,具体包括:基于最大熵括号转录语法的翻译模型,基于源语言短语结构树的树到串翻译模型及其相应的基于树的翻译... 该文总结了我们近几年来在基于句法的统计机器翻译方面所做的研究工作,特别是基于源语言句法的一系列统计机器翻译模型与方法,具体包括:基于最大熵括号转录语法的翻译模型,基于源语言短语结构树的树到串翻译模型及其相应的基于树的翻译方法,基于森林的翻译方法和句法分析与解码一体化翻译方法,基于源语言依存树的翻译模型。 展开更多
关键词 统计机器翻译 基于句法的翻译模型 基于句法的翻译方法
在线阅读 下载PDF
模糊匹配在树到串翻译模型中的应用 被引量:1
8
作者 熊皓 刘洋 刘群 《中文信息学报》 CSCD 北大核心 2011年第2期66-71,共6页
在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则... 在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则无法匹配的现象很常见,特别是在树到树的翻译模型中,能够精确匹配的规则数量非常稀少,进而对机器翻译的性能造成很大影响。因此该文提出了一种基于树核的模糊匹配技术,在NIST 2005汉英翻译测试集上的结果表明,基于树核的模糊匹配模型相对于传统的翻译模型显著的提高了1.3个BLEU值,并且在森林模型中使用模糊匹配技术仍然能够提高0.7个BLEU值。 展开更多
关键词 树核 树到串翻译模型 统计机器翻译 模糊匹配
在线阅读 下载PDF
基于深度序列翻译模型的非侵入式负荷分解方法 被引量:31
9
作者 任文龙 许刚 《电网技术》 EI CSCD 北大核心 2020年第1期27-34,共8页
智能用电的一个重要环节是能量监测,其关键技术是非侵入式负荷分解,为了提高居民负荷分解的准确性,将序列翻译模型应用到非侵入式负荷分解之中。首先确定电器在不同模式的运行功率,同时将电器的运行模式进行组合编码,将所有电器的运行... 智能用电的一个重要环节是能量监测,其关键技术是非侵入式负荷分解,为了提高居民负荷分解的准确性,将序列翻译模型应用到非侵入式负荷分解之中。首先确定电器在不同模式的运行功率,同时将电器的运行模式进行组合编码,将所有电器的运行状态用一个状态码进行表示。其次,考虑电器运行过程中的时间关联关系,结合序列翻译模型理论,将待分解的信号与电器的状态码在序列翻译模型上进行映射训练,同时运用Dropout技术和稀疏化技术对模型进行优化以确定较优的网络参数。构建的序列翻译模型综合应用了电器运行模式的时间尺度信息与信号幅值特性,将待分解的能量翻译为状态码,从而实现负荷能量的分解。最后,利用公开数据集进行验证,结果表明所提方法有较高的能量分解准确率。 展开更多
关键词 非侵入式负荷分解 组合编码 序列翻译模型 居民负荷 深度学习
在线阅读 下载PDF
常用统计翻译模型在口语汉英翻译中的比较研究 被引量:1
10
作者 李俊 薛永增 赵铁军 《计算机应用研究》 CSCD 北大核心 2007年第6期69-71,74,共4页
通过汉语到英语的翻译实验以及对结果译文的分析,对基于词的模型、基于短语的模型和基于句法的模型的翻译性能进行了比较。结果表明基于短语的模型性能优于其他两个模型,但是使用的参数较多;基于句法的模型虽然翻译性能不理想,但可以用... 通过汉语到英语的翻译实验以及对结果译文的分析,对基于词的模型、基于短语的模型和基于句法的模型的翻译性能进行了比较。结果表明基于短语的模型性能优于其他两个模型,但是使用的参数较多;基于句法的模型虽然翻译性能不理想,但可以用较少的参数表达更丰富的信息,值得深入研究。 展开更多
关键词 自然语言处理 统计机器翻译 翻译模型 句法分析器
在线阅读 下载PDF
对齐模板在标准短语统计机器翻译模型中的应用 被引量:2
11
作者 张步峰 孙越恒 赵青 《电子测量技术》 2007年第7期146-149,161,共5页
在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够... 在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够较好处理数据稀疏的问题,短语对可以使翻译更加精确。本文提出在基于最大熵的标准短语翻译模型下模拟对齐模板,模拟的对齐模板被作为一个单独的特征函数加入到此翻译模型中。实验在中英翻译和法英翻译上进行,实验结果证明,本文方法明显改善了标准短语翻译模型的翻译效果。 展开更多
关键词 统计机器翻译 标准短语翻译模型 对齐模板 最大熵模型
在线阅读 下载PDF
基于翻译模型的异质重边信息网络链路预测研究 被引量:1
12
作者 郑建兴 李沁文 +1 位作者 王素格 李德玉 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第4期541-548,共8页
在异质信息网络中,异质节点对象之间具有多元关系,形成异质重边信息网络.知识图谱表示旨在将实体和关系在低维的向量空间进行嵌入,可以用来学习异质重边信息网络中实体间的多元关系.首先通过注意力机制对异质重边信息网络中的多元关系... 在异质信息网络中,异质节点对象之间具有多元关系,形成异质重边信息网络.知识图谱表示旨在将实体和关系在低维的向量空间进行嵌入,可以用来学习异质重边信息网络中实体间的多元关系.首先通过注意力机制对异质重边信息网络中的多元关系进行融合表示,进而将异质节点的类型信息进行多元关系融合空间的映射,在多元关系融合空间上提出基于翻译的异质重边嵌入模型,用以学习异质节点之间的链路关系.最后,在MovieLens100k电影数据集上进行了异质节点多元关系的链路预测实验.实验结果表明,在异质重边信息网络中,基于改进的翻译模型在实体间链路预测性能方面要优于传统的知识表示方法,可以有效地提升链路预测的精度. 展开更多
关键词 异质重边信息网路 链路预测 翻译模型 表示学习
在线阅读 下载PDF
用于短文本关键词抽取的主题翻译模型 被引量:1
13
作者 王瑞 秦永彬 +1 位作者 张丽 闫盈盈 《计算机工程与设计》 北大核心 2018年第6期1633-1638,共6页
为进一步改善短文本关键词抽取的效果,提出一种TTKE(topical translation for keyphrase extraction)主题翻译模型。结合主题模型与统计机器翻译模型的优势,通过长文本辅助短文本进行主题发现,学习特定主题下词语与关键词的对齐概率,为... 为进一步改善短文本关键词抽取的效果,提出一种TTKE(topical translation for keyphrase extraction)主题翻译模型。结合主题模型与统计机器翻译模型的优势,通过长文本辅助短文本进行主题发现,学习特定主题下词语与关键词的对齐概率,为给定短文本进行关键词抽取。在真实数据集上进行实验,实验结果表明,该模型能够有效提高短文本关键词抽取的效果。 展开更多
关键词 关键词抽取 短文本 长文本 主题翻译模型 主题发现 对齐概率
在线阅读 下载PDF
基于话题翻译模型的双语文本纠错 被引量:1
14
作者 陈欢 张奇 《计算机应用与软件》 CSCD 2016年第3期284-287,共4页
近年来,随着信息全球化的影响,社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的,并不能很好地处理多语言混合的文本,因此在进行其他自然语... 近年来,随着信息全球化的影响,社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的,并不能很好地处理多语言混合的文本,因此在进行其他自然语言处理任务之前对文本进行预处理显得尤为重要。面对网络文本语义空间双语对齐语料的匮乏,提出一种基于话题翻译模型的方法,利用不同语义空间的语料计算网络文本语义空间的双语对齐概率,再结合神经网络语言模型将网络混合文本中的英文翻译成对应中文。实验在人工标注的测试语料上进行,实验结果表明,通过不同的对比试验证明文中的方法是有效的,能提升翻译正确率。 展开更多
关键词 网络文本 话题翻译模型 神经网络语言模型
在线阅读 下载PDF
基于态度的政治隐喻翻译模型研究——以《习近平谈治国理政》英译本为例 被引量:18
15
作者 侯奕茜 《外国语文》 北大核心 2021年第4期122-130,共9页
政治家通过态度的构建实现沟通和说服的人际意义,而隐喻是重要的表态资源,因此政治语篇中隐喻翻译就显得至关重要。本文从概念隐喻以及评价理论态度系统出发,搭建基于态度的政治隐喻翻译模型。以该模型为基础,提出判定政治隐喻翻译有效... 政治家通过态度的构建实现沟通和说服的人际意义,而隐喻是重要的表态资源,因此政治语篇中隐喻翻译就显得至关重要。本文从概念隐喻以及评价理论态度系统出发,搭建基于态度的政治隐喻翻译模型。以该模型为基础,提出判定政治隐喻翻译有效性的三种情形:隐喻+态度共同映射、有限映射、映射失效,总结了三种翻译策略:本域映射、换域映射和去域映射,并以《习近平谈治国理政》英译本为案例进行分析和讨论。 展开更多
关键词 基于态度的政治隐喻翻译模型 本域映射 换域映射 去域映射
在线阅读 下载PDF
基于超图的翻译模型融合的研究
16
作者 刘宇鹏 李生 赵铁军 《软件学报》 EI CSCD 北大核心 2012年第9期2347-2357,共11页
当前,系统融合是在机器翻译的后处理上进行.提出了在解码过程中来融合翻译模型,融合了主流两个翻译系统的翻译模型(层次化的基于短语的文法Hiero和括号转录文法BTG).并从理论和实践的角度探索了现在主流的两种解码方法.同时,所提出的解... 当前,系统融合是在机器翻译的后处理上进行.提出了在解码过程中来融合翻译模型,融合了主流两个翻译系统的翻译模型(层次化的基于短语的文法Hiero和括号转录文法BTG).并从理论和实践的角度探索了现在主流的两种解码方法.同时,所提出的解码方法解决了伪歧义或一致性问题.在实验结果上得出:多文法模型融合的标志性要好于成员翻译模型;新的解码方法标志性好于传统解码方法(Viterbi解码). 展开更多
关键词 超图 推导 规则 翻译模型融合 伪歧义 一致性翻译
在线阅读 下载PDF
基于现代智能识别技术的英语机器翻译模型 被引量:4
17
作者 张帆 《现代电子技术》 北大核心 2018年第16期151-154,共4页
基于句法分析的英语机器翻译方法无法解决智能识别技术中海量英语语言的部分结构歧义导致机器翻译准确度低的问题。因此,在分析智能机器翻译工具辅助英语翻译应用的基础上,设计与实现基于现代智能识别技术的英语机器翻译模型。依据英文... 基于句法分析的英语机器翻译方法无法解决智能识别技术中海量英语语言的部分结构歧义导致机器翻译准确度低的问题。因此,在分析智能机器翻译工具辅助英语翻译应用的基础上,设计与实现基于现代智能识别技术的英语机器翻译模型。依据英文句子产生中文句子和对齐过程,基于英文句子获取中文句子长度、首个中文词串的链接位置,获取总体中文句子以及机器翻译对在句子中的次数。采用基于最大熵的统计机器翻译方法,通过直接最大熵模型训练得到相关参数,获取不同英语语言特征间的最佳组合方式,解决海量英语语言中的部分结构歧义问题,提高英语机器翻译的准确度。实验结果表明,所设计的英语机器翻译模型,具有较高的翻译准确度和稳定性。 展开更多
关键词 智能识别技术 英语翻译 机器翻译模型 结构歧义 最大熵 翻译准确度
在线阅读 下载PDF
基于翻译模型的知识表示发展综述
18
作者 张正航 《南方农机》 2020年第7期245-245,共1页
知识图谱在人工智能上有很大的研究价值,并被广泛应用于语义搜索和自动问答等领域,基于翻译模型的知识表示已成为知识图谱领域研究的热点。知识图谱表示将包含了实体和关系的大规模知识图谱映射到一个连续的向量空间。为此,有一系列知... 知识图谱在人工智能上有很大的研究价值,并被广泛应用于语义搜索和自动问答等领域,基于翻译模型的知识表示已成为知识图谱领域研究的热点。知识图谱表示将包含了实体和关系的大规模知识图谱映射到一个连续的向量空间。为此,有一系列知识表示模型提出,其中基于翻译模型的经典方法TransE不仅模型复杂度低、计算效率高,而且同样具有良好的知识表达能力。文章对翻译模型进行了概述,着重分析了翻译模型的常用方法,仅供参考。 展开更多
关键词 知识图谱 知识表示 翻译模型 TransE 应用
在线阅读 下载PDF
短语统计机器翻译的句法调序模型 被引量:6
19
作者 薛永增 李生 +1 位作者 赵铁军 杨沐昀 《通信学报》 EI CSCD 北大核心 2008年第1期7-14,共8页
为了处理统计机器翻译中的长距离调序,在基于短语的统计翻译模型的基础上提出了句法调序模型。该模型按照短语切分来分割句法树结构,从而能够避免短语和句法结构的不一致性。在该模型中依据短语对齐和短语内词对齐确定句法树部分结构的... 为了处理统计机器翻译中的长距离调序,在基于短语的统计翻译模型的基础上提出了句法调序模型。该模型按照短语切分来分割句法树结构,从而能够避免短语和句法结构的不一致性。在该模型中依据短语对齐和短语内词对齐确定句法树部分结构的调序顺序,依据各个节点上的调序概率计算子结构的调序概率,作为对数线性模型的特征函数。该模型的实验结果比经典的短语统计翻译模型的BLEU评分有明显提高。结果表明句法调序模型对于基于短语的统计机器翻译是有效的,能够较好地将句法知识和短语翻译过程结合起来。 展开更多
关键词 人工智能 统计翻译模型 句法调序 短语
在线阅读 下载PDF
机器翻译的语言模型和格语法 被引量:2
20
作者 顾跃挺 《情报学报》 1987年第2期118-123,共6页
文章论述了采用直接翻译方法的机器翻译系统在某些问题上的严重缺陷,评价了转换一生成语言模型的优缺点,并在此基础上建立了格语法翻译模型。作者认为,格语法的语义形式化方法适于建立机器配译的中间结构。以这个语义结构为媒介,就... 文章论述了采用直接翻译方法的机器翻译系统在某些问题上的严重缺陷,评价了转换一生成语言模型的优缺点,并在此基础上建立了格语法翻译模型。作者认为,格语法的语义形式化方法适于建立机器配译的中间结构。以这个语义结构为媒介,就能完全按照自身规律生成目标语。 展开更多
关键词 机器翻译系统 语言模型 格语法 语义结构 形式化方法 翻译方法 翻译模型 中间结构
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部