-
题名多策略机器翻译研究综述
被引量:21
- 1
-
-
作者
李业刚
黄河燕
史树敏
冯冲
苏超
-
机构
北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心
山东理工大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2015年第2期1-9,23,共10页
-
基金
国家重点基础研究发展计划(973)(2013CB329303)
国家自然科学基金(61132009)
国家自然科学基金(61202244)
-
文摘
该文全面综述和分析了多策略机器翻译的研究。根据所采用策略方式的差异,我们将多策略机器翻译分为系统级策略融合和模块级策略融合。在分别介绍了不同的翻译方法后,着重介绍了系统级策略融合和模块级策略融合各自具有代表性的研究工作。最后,对多策略机器翻译的研究进行了展望。
-
关键词
机器翻译
多策略机器翻译
融合机器翻译
混合机器翻译
多引擎机器翻译
-
Keywords
machine translation
multi-strategy MT
system combination for MT
hybrid-MT
multi-engine MT
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名大规模句子相似度计算方法
被引量:6
- 2
-
-
作者
黄河燕
陈肇雄
张孝飞
张克亮
-
机构
中国科学院计算机语言信息工程研究中心
南京理工大学
-
出处
《中文信息学报》
CSCD
北大核心
2006年第B03期47-52,共6页
-
基金
国家自然科学基金资助项目(60502048,60272088)
国家863计划资助项目(2002AA117010-02)
-
文摘
如何根据源语言文本从大规模语料库中找出其最相近的翻译实例,即句子相似度计算,是基于实例翻译方法的关键问题之一。本文提出一种多层次句子相似度计算方法:首先基于句子的词表层特征和信息熵从大规模语料库中选择出少量候选实例,然后针对这些候选实例进行泛化匹配,从而计算出相似句子。在多策略机器翻译系统IHSMTS中的实验表明,当语料规模为20万英汉句对时,系统提取相似句子的召回率达96%。准确率达90%,充分说明了本文算法的有效性。
-
关键词
句子相似度
基于实例的机器翻译
多策略机器翻译
泛化匹配
-
Keywords
sentence similarity
example-based machine translation
hybrid-strategy machine translation
generaliza-tion matching
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名IHSMTS中实例模式获取机制的设计与实现
被引量:3
- 3
-
-
作者
黄河燕
陈肇雄
胡曾剑
-
机构
中国科学院计算机语言信息工程研究中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第5期588-592,共5页
-
基金
国家自然科学基金资助 ( 69882 0 0 6)
-
文摘
IHSMTS是一种交互式多策略机器翻译系统 .给出了该系统中模式知识获取机制的设计和实现方法 ,在这种模式知识获取机制中有机地结合了多种知识获取方式 ,包括 :人机交互方式、基于机器翻译的源译文对照信息的自动获取、模式精炼方式和基于先验双语语料对齐的批量方式等 ,并通过模式验证算法实现对冗余、冲突等的检查 ,从而保证加入到模式库中的模式知识的单调递增性 ,同时实现模式适应性和准确性的平衡 ,使系统能够对实例模式库进行动态添加完善 。
-
关键词
多策略机器翻译系统
知识获取
IHSMTS
实例模式获取机制
设计
-
Keywords
case model acquisition, hybrid strategies machine translation, machine learning
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-