期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
集成多种特征匹配中文实体名称
1
作者 巩军 《计算机工程与应用》 CSCD 2012年第27期136-141,共6页
准确匹配实体名称在信息系统集成中有广泛的应用,而在中文环境中,实体名称的变化和笔误使得中文实体名称难以准确匹配,所以需要开发出适应这些变化和笔误的匹配方法。中文实体名称的相似度从字、词、语义三个层次计算出来,将这些相似度... 准确匹配实体名称在信息系统集成中有广泛的应用,而在中文环境中,实体名称的变化和笔误使得中文实体名称难以准确匹配,所以需要开发出适应这些变化和笔误的匹配方法。中文实体名称的相似度从字、词、语义三个层次计算出来,将这些相似度线性合并起来,集成各自的优势。为了利用更多的匹配特征,引入了两种机器学习的方法:第一种方法通过训练获得一个优化排序和最佳切分点;第二种方法利用支持向量机来判断两个名称是否指向同一实体。在中文实体名称的数据集上的实验表明,这些方法和特征有效提高了匹配的效果。 展开更多
关键词 字符串相似度 名字消歧 名字匹配 机器学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部