-
题名基于字词混合的中文实体关系联合抽取方法
被引量:10
- 1
-
-
作者
葛君伟
李帅领
方义秋
-
机构
重庆邮电大学计算机科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2021年第9期2619-2623,共5页
-
基金
国家自然科学基金面上项目(62072066)。
-
文摘
针对中文关系抽取中分词时引起的边界切分出错而造成的歧义问题,以及出现实体对重叠不能提取出所涉及的多个关系问题,提出一种基于字词混合的联合抽取方法。首先,对于分词边界问题,嵌入层在词向量的基础上结合字向量,并且增加位置信息来保证字与字之间的正确顺序。其次,模型引入混合扩张卷积网络进行不同粒度、更远距离的特征提取。最后,采用分层标注方法,通过得到的主实体信息标记对应的关系和客实体,每个主实体可对应多个关系和客实体。与其他关系抽取方法在相同中文数据集上进行实验对比,实验结果表明,该方法的抽取效果最佳,并且也表现出更好的稳定性。
-
关键词
关系抽取
分词
字词混合
边界切分
混合扩张卷积
-
Keywords
relation extraction
word segmentation
word mixing
boundary segmentation
mixed expansion convolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-