-
题名《同义词词林》在中文实体关系抽取中的作用
被引量:28
- 1
-
-
作者
刘丹丹
彭成
钱龙华
周国栋
-
机构
苏州大学自然语言处理实验室
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2014年第2期91-99,共9页
-
基金
国家自然科学基金(60873150
90920004)
+1 种基金
江苏省自然科学基金(BK2010219
11KJA520003)
-
文摘
语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了词汇语义信息和实体类型信息之间的冗余性。在ACE2005中文语料库上的关系抽取实验表明,在未知实体类型的前提下,语义信息能显著提高抽取性能;而在已知实体类型的情况下,语义信息也能明显提高某些关系类型的抽取性能,这说明《词林》语义信息和实体类型信息在中文语义关系抽取中具有一定的互补性。
-
关键词
中文实体关系抽取
树核函数
同义词词林
语义信息
-
Keywords
Chinese entity relation extraction
tree kernel
TongYiCi CiLin
semantic information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名词汇语义信息对中文实体关系抽取影响的比较
被引量:11
- 2
-
-
作者
刘丹丹
彭成
钱龙华
周国栋
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2012年第8期2238-2244,共7页
-
基金
国家自然科学基金资助项目(60873150
90920004)
+1 种基金
江苏省自然科学基金资助项目(BK2010219
11KJA520003)
-
文摘
提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程度上提高中文关系抽取的性能;同时,《同义词词林》能补充实体类型信息的不足,因而无论是否加入实体类型信息,其语义信息都能大幅度地提高大部分关系类型的抽取性能;而《知网》则和实体类型信息存在冲突,因此在已知实体类型信息的前提下,仅能提高个别关系类型的抽取性能。
-
关键词
中文实体关系抽取
树核
《同义词词林》
《知网》
语义信息
-
Keywords
Chinese entity relation extraction
tree kernel
TongYiCi CiLin
HowNet
semantic-information
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于核方法的中文实体关系抽取研究
被引量:19
- 3
-
-
作者
黄瑞红
孙乐
冯元勇
黄云平
-
机构
中国科学院软件研究所
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期102-108,共7页
-
基金
国家自然科学基金资助项目(6077302760736044)
国家863计划重点资助项目(2006AA010108)
-
文摘
命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。
-
关键词
计算机应用
中文信息处理
中文实体关系抽取
核方法
卷积树核
复合核
最短路径依赖核
-
Keywords
computer application
Chinese information processing
Chinese relation extraction
Kernel-based methods
convolution tree kernel
composite kernels
shortest path dependency kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于依存分析的开放式中文实体关系抽取方法
被引量:28
- 4
-
-
作者
李明耀
杨静
-
机构
上海市多维度信息处理重点实验室
华东师范大学计算机科学技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第6期201-207,共7页
-
基金
上海市科委基金资助项目(14511107000)
-
文摘
实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提出一种开放式中文实体关系抽取方法。对输入的单句进行依存分析,通过依存分析输出的依存弧判断单句是否为动词谓语句,如果是动词谓语句则结合中文语法启发式规则抽取关系表述。根据距离确定论元位置,对三元组进行评估,输出符合条件的三元组。在Sogou CA和Sogou CS语料库上的实验结果表明,提出的方法适用于大规模语料库,具有较好的性能与可移植性。与基于卷积树核的无监督层次聚类方法相比,F值提高了16.68%。
-
关键词
开放式信息抽取
中文实体关系抽取
依存分析
无监督
启发式规则
-
Keywords
Open Information Extraction(OIE)
Chinese entity relation extraction
dependency parsing
unsupervised
heuristic rule
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-