摘要
针对当前中文开放领域多元实体关系抽取研究较少的情况,借鉴国外已有的研究成果,结合中文自身的特点,提出了中文领域多元实体关系抽取的方法。该方法以句法分析结果的根节点作为入口,迭代地获取所有谓语的主语、宾语及其定语成分,再利用句法分析结果对这些成分进行完善,最终获取句子中的多个实体之间的语义关系。该方法被应用在不同的领域并进行了对比分析,实验结果表明:其具有一定的参考价值。另外,对实验数据进行了详细的分析,归纳了错误的主要情形,为今后的研究工作指明了方向。
In view of the scant research conducted regarding n-ary entity relation extraction in the Chinese open domain,in this paper,we propose a method for performing n-ary entity relation extraction in the Chinese domain based on exist-ing research conducted abroad and Chinese characteristics.Starting with the root node of syntactic analysis,we obtain the subject,object,and attributive components of all the predicates.Then,we use the syntactic analysis result to perfect these elements and,finally,obtain the semantic relations of the n-ary entity.For comparative analysis,we applied the proposed method to different domains.The experimental results demonstrate its reference value.In addition,we analyzed the experimental data in detail and have summarized the main errors,which indicate the direction for future research.
作者
姚贤明
甘健侯
徐坚
YAO Xianming;GAN Jianhou;XU Jian(School of Information Engineering,Qujing Normal University,Qujing 655011,China;Key Laboratory of Educational Informatizationfor Nationalities (YNNU),Ministry of Education,Kunming 650500,China)
出处
《智能系统学报》
CSCD
北大核心
2019年第3期597-604,共8页
CAAI Transactions on Intelligent Systems
基金
国家自然科学基金项目(61562093)
云南省应用基础研究计划重点项目(2016FA024)
关键词
中文、开放域
多元实体关系
依存句法分析
句法结构
关系抽取
语义关系
主谓宾
Chinese open domain
n-ary entity relation
dependency syntax analysis
semantic structure
relation extraction
semantic relation
subject predicate object
作者简介
姚贤明,男,1984年生,讲师,主要研究方向为本体、知识图谱和问答系统。参与国家和省级科研项目10余项。发表学术论文6篇;甘健侯,男,1976年生,教授,博士生导师,主要研究方向为智能信息处理、计算机教育。主持国家自然科学基金项目3项,国家软科学项目3项,中央财政专项项目1项,教育部项目2项。发表学术论文50余篇,被SCI、EI、CSSCI检索20余篇,出版专著3部;通信作者:徐坚,E-mail:qjncxj@126.com,男,1977年生,副教授,主要研究方向为知识图谱、自然语言处理、教育信息化。发表学术论文40余篇,出版教材4部。