-
题名基于模板的机器翻译系统中模板库的自动构建技术
被引量:4
- 1
-
-
作者
林贤明
李堂秋
史晓东
-
机构
厦门大学计算机科学系
-
出处
《计算机应用》
CSCD
北大核心
2004年第9期127-128,135,共3页
-
基金
国家 8 63计划项目 (2 0 0 1AA1 1 4 1 1 0 )
福建省科技重点项目 (2 0 0 1H0 2 3)
-
文摘
基于模板的机器翻译 (TemplateBasedMachineTranslation ,TBMT)系统需要一个具有较大规模、句型覆盖面广泛的模板库 ,而这样的模板库单凭手工无法构建 ,需要利用计算机自动构建 ,提出了一种利用基于动态规划的相似模型与基于系统聚类法的分类模型 ,从句子对齐的双语语料库中抽取模板库的方法。该方法是在句子对齐的语料库中 ,首先运用系统聚类法对其进行聚类 ,使得包含相同模板的句子对被聚成一类 ,然后根据句子的相似度模型计算句子之间的相似度 ,进而从各个子类中将模板抽取出来 ,构建出整个模板库。
-
关键词
模板库
自动抽取
系统聚类
相似度模型
基于模板的机器翻译
-
Keywords
template library
auto-extration
system cluster
similarity model
TBMT
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-