-
题名谓词概念连通度的中文实体关系抽取策略
被引量:1
- 1
-
-
作者
夏家莉
程春雷
陈辉
曹重华
李光泉
-
机构
江西财经大学信息管理学院
江西中医药大学计算机学院
江西财经大学软件与通信工程学院
-
出处
《计算机科学与探索》
CSCD
2014年第11期1345-1357,共13页
-
基金
国家自然科学基金
江西省科技支撑计划
+2 种基金
江西省自然科学基金
江西省卫生厅中医药科研计划
江西省教育厅科学基金项目~~
-
文摘
中文实体关系抽取是开放域文本检索与知识发现的研究热点,传统的抽取策略普遍存在人工标注量大,模式通用性受限,关系抽取粒度相对固定等问题,限制了其在开放领域的关系抽取效果。基于概念的结构分层和关系连通,面向中文实体关系构建了谓词概念模型(predicate concept model,PCM),在此基础上,提出了增量学习的谓词概念获取策略PCIA和基于谓词概念连通的关系抽取策略PCCS,由此进行了开放域非紧密的、远距离实体关系的抽取。各谓词概念的构建相对独立,概念组合更为灵活,对关系的描述具有更好的通用性和可解释性,为开放域未知关系的识别与抽取提供了有效手段。实验结果表明,PCCS有效提升了中文实体识别及实体连通路径选择的质量,获得了良好的关系抽取性能。
-
关键词
实体关系
谓词概念模型(PCM)
概念相关度
概念连通度
-
Keywords
entities relationship
predicate concept model (PCM)
concept association degree
concept connectivity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-