-
题名融合依存分析和图注意网络的三元组抽取
被引量:5
- 1
-
-
作者
翟社平
柏晓夏
张宇航
成大宝
-
机构
西安邮电大学计算机学院
陕西省网络数据分析与智能处理重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第12期148-156,共9页
-
基金
国家自然科学基金(61373116)
工业和信息化部通信软科学项目(2018R26)
+2 种基金
陕西省大学生创新创业训练计划项目(S202111664077)
陕西省重点研发计划项目(2022GY-038)
西安邮电大学研究生创新基金项目(CXJJLY202013)。
-
文摘
传统的三元组抽取采用流水线方式分阶段进行命名实体识别和关系抽取,导致实体识别的精度直接影响关系抽取的效果,造成句子上下文信息缺失,以及实体关系重叠问题等。为此,提出了结合依存分析、图注意力网络和对抗训练的三元组联合抽取模型,该模型将句子输入到BiLSTM层提取单词特征,利用可学习的线性单元进行特征强化,同时将句子输入到句法分析层生成的约束矩阵;将强化后的单词特征与依存约束矩阵输入到图注意力网络提取句子序列特征和单词的局部依赖特征,共同计算图注意力系数;再使用Sigmoid层预测出句子中的实体和实体关系;在词嵌入层加入对抗训练改善模型鲁棒性。实验采用公共数据集NYT验证了模型抽取三元组的准确率,同时召回率也显著提升,与现有的流水线和联合方法相比,改善了误差累积、关系重叠问题。
-
关键词
知识图谱
三元组联合抽取
图注意力网络
依存分析
对抗训练
-
Keywords
knowledge graph
triple joint extraction
graph attention network
dependency analysis
adversarial training
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-