-
题名层次短语翻译模型的介词短语调序
被引量:3
- 1
-
-
作者
冯洋
张冬冬
刘群
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
微软亚洲研究院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第1期31-36,共6页
-
文摘
在不同的语言中,句法成分的相对位置往往不同,介词短语表现尤为明显,因此正确的对介词短语进行调序对提高翻译质量至关重要。层次短语模型借助于形式语法规则,具有较强的处理长距离调序的能力,但是其并不对短语的句法成分进行区分,这会导致规则的使用不当,从而引起翻译错误。该文在层次短语模型的基础上,针对介词短语进行处理。首先利用条件随机场模型识别出介词短语,然后抽取出带有介词短语的规则,构建一个新的同步上下文无关文法。解码的时候,在这个同步上下文无关文法定义的空间里搜索找到最优的译文。相对于层次短语模型,该方法在我们内部的英汉数据集上调高了0.8个BLEU百分点,在NIST 2008英汉翻译数据集上提高了0.5个BLEU百分点。
-
关键词
统计机器翻译
层次短语模型
介词短语调序
条件随机场
-
Keywords
statistical machine translation
hierarchical phrase-based translation
prepositional phrase reordering
conditional random field
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-