-
题名基于同步树序列替换文法的统计机器翻译模型
被引量:2
- 1
-
-
作者
蒋宏飞
李生
张民
赵铁军
杨沐昀
-
机构
哈尔滨工业大学计算机科学与技术学院机器智能与翻译研究室
新加坡信息通讯研究所
-
出处
《自动化学报》
EI
CSCD
北大核心
2009年第10期1317-1326,共10页
-
基金
国家自然科学基金重点项目(60736014)
国家高技术研究发展计划(863计划)重点项目(2006AA010108)资助~~
-
文摘
基于短语的模型是目前发展相对成熟的一种统计机器翻译(Statistical machine translation,SMT)模型.但基于短语的模型不包含任何结构信息,因而缺乏有效的全局调序能力,同时不能对非连续短语进行建模.基于句法的模型因具有结构信息而具有解决以上问题的潜力,因而越来越受到研究者们的重视.然而现有的大多数基于句法的模型都因严格的句法限制而制约了模型的描述能力.为突破这种限制并将基于短语的模型的优点融入到句法模型中,本文提出一种基于同步树序列替换文法(Synchronous tree sequence substitution grammar,STSSG)的统计机器翻译模型.在此模型中,树序列被用作为基本的翻译单元.在这种框架下,不满足句法限制的翻译等价对和满足句法限制的翻译等价对都可以融入句法信息并被翻译模型所使用.从而,两种模型的优点均得到充分利用.在2005年度美国国家标准与技术研究所(NIST)举办的机器翻译评比的中文翻译任务语料上的实验表明,本文提出的模型显著地超过了两个基准系统:基于短语的翻译系统Moses和一个基于严格树结构的句法翻译模型.
-
关键词
统计机器翻译
句法限制
同步文法
同步树替换文法
同步树序列替换文法
-
Keywords
Statistical machine translation (SMT), syntactic constraint, synchronous grammar, synchronous tree substitution grammar, synchronous tree sequence substitution grammar (STSSG)
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-