-
题名一种融合实体语义知识的实体集合扩展方法
被引量:4
- 1
-
-
作者
齐振宇
刘康
赵军
-
机构
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2013年第2期1-9,共9页
-
基金
国家自然科学基金资助项目(61070106
61202329
+4 种基金
61272332)
国家973计划资助项目(2012CB316300)
中国科学院先导专项资助项目(XDA06030300)
国家863高科技计划资助项目(2012AA011102)
清华大学信息科学与技术国家实验室(筹)资助
-
文摘
实体集合扩展是开放式信息抽取的一个重要问题,该问题研究如何从一个语义类的若干实体(称为种子)出发,得到该类别的更多实体。现有实体集合扩展方法主要使用上下文模板或种子在语料中的分布信息进行抽取,其缺点是无法解决种子的歧义问题,而该问题会影响方法的有效性。在该文中,作者提出了一种融合实体语义知识的实体集合扩展方法,通过引入语义知识来解决种子歧义性问题。新方法通过使用Wikipedia实现了语义知识的引入,并把基于语义知识的扩展方法和基于模板的扩展方法相融合。实验表明,与单纯基于上下文方法相比,该文方法在准确率上提升了18.5%,召回率上提升了6.8%,MAP值上提升了22.8%。
-
关键词
实体集合扩展
知识库
语义知识
-
Keywords
Entity Set Expansion
knowledge base
semantic knowledge
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-