-
题名基于中心语块扩展的短语对齐
被引量:3
- 1
-
-
作者
张春祥
李生
赵铁军
-
机构
哈尔滨工业大学计算机科学与技术学院语言语音教育部-微软重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第9期1658-1665,共8页
-
基金
国家"八六三"高技术研究发展计划基金项目(2002AA11701009)
国家自然科学基金重点项目(60435020)
-
文摘
短语等价对在词典编纂、机器翻译和跨语言信息检索中有着广泛的应用.提出了一种新的短语对齐方法,使用可信度较高的词典对齐结果来抽取源语言短语的译文中心语块,依据译文扩展可信度来确定源语言短语的译文统计边界.从译文中心语块出发,结合译文统计边界生成源语言短语的所有候选译文.对候选译文进行评价,从中选出最可靠的译文.同时利用贪心算法消除源语言短语译文边界之间的交叉冲突.实验结果表明,所提出的方法在开放测试中其正确率达到了82.76%,性能好于其他方法.
-
关键词
短语等价对
译文中心语块
贪心算法
-
Keywords
phrase equivalence pair
translation head-phrase
greedy algorithm
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名基于中心语块扩展的短语翻译对自动获取
- 2
-
-
作者
张春祥
李生
赵铁军
-
机构
哈尔滨工业大学语言语音教育部-微软重点实验室
哈尔滨工业大学计算机科学与技术学院
-
出处
《高技术通讯》
CAS
CSCD
北大核心
2006年第9期893-898,共6页
-
基金
863计划(2004AA117010-08)和国家自然科学基金(60435020)资助项目.
-
文摘
提出了一种短语翻译对获取方法.该方法使用完全基于词典的对齐结果来确定源语言短语的译文中心语块,依据完全基于词典和多策略相融合的对齐结果的并集来确定其译文最大边界.从中心语块出发,结合译文最大边界生成源语言短语的所有候选译文.同时对其进行评价,从中选出对应的目标语译文.实验结果表明:在开放测试中,这种方法的正确率达到了81.53%,性能好于其它方法.
-
关键词
短语翻译对
译文中心语块
译文最大边界
-
Keywords
phrase translation pair, translation head-phrase, maximum translation boundary
-
分类号
H315.9
[语言文字—英语]
-