-
题名基于词串粒度及权值的汉语句子相似度衡量
被引量:13
- 1
-
-
作者
王荣波
池哲儒
常宝宝
柏晓静
-
机构
香港理工大学电子及资讯工程系多媒体信号处理中心
北京大学计算语言所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2005年第13期142-144,共3页
-
文摘
提出了一种改进的汉语句子相似度衡量方法,用于基于实例的汉英机器翻译。该方法同时考虑了相同词串的数目及长度和对应的权值信息,克服了传统方法的显著不足,在理论上更有合理性。在小数据集上的实验也表明该方法是可行的。
-
关键词
基于实例机器翻译
汉英机器翻译
句子相似度衡量
自然语言处理
-
Keywords
Example-based machine translation(EBMT)
Chinese-English machine translation
Sentence similarity measure
Natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词类串的汉语句子结构相似度计算方法
被引量:28
- 2
-
-
作者
王荣波
池哲儒
-
机构
香港理工大学电子及资讯工程系多媒体信号处理中心
-
出处
《中文信息学报》
CSCD
北大核心
2005年第1期21-29,共9页
-
文摘
句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的汉英机器翻译研究 ,汉语句子相似度衡量的准确性 ,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似性的计算方法。该方法比较两个句子的词类信息串 ,进行最优匹配 ,得到一个结构相似性的值。在小句子集上的初步实验结果表明 ,该方法可行 ,有效 ,符合人的直观判断。
-
关键词
人工智能
机器翻译
基于实例机器翻译
汉英机器翻译
句子相似度衡量
自然语言处理
-
Keywords
artificial intelligence
machine translation
example-based machine translation
Chinese-English machine translation
sentence similarity measure
natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-