-
题名基于双仿射注意力的迭代式开放域信息抽取
- 1
-
-
作者
李欣
邵靖淇
王昊
何丽
段建勇
-
机构
北方工业大学信息学院
CNONIX国家标准应用与推广实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第7期2046-2051,共6页
-
基金
国家重点研发计划资助项目(2020AAA0109700)
国家自然科学基金资助项目(62076167,61972003)
+1 种基金
北京市教委研发计划资助项目(KM202210009002)
北方工业大学北京城市治理研究基地项目(2023CSZL16)。
-
文摘
当前的开放域信息抽取(OpenIE)方法无法同时兼顾抽取结果的紧凑性和模型的性能,导致其抽取结果不能更好地被应用到下游任务中。为此,提出一个基于双仿射注意力进行表格填充及迭代抽取的模型。首先,该模型通过双仿射注意力学习单词之间的方向信息、捕获单词对之间的相互作用,随后对二维表格进行填充,使句子中的成分相互共享并识别紧凑成分;其次,使用多头注意力机制将谓词和参数的表示应用于上下文的嵌入中,使谓词和参数的提取相互依赖,更好地链接关系成分和参数成分;最后,对于含有多个关系成分的句子,使用迭代抽取的方式在无须重新编码的情况下捕获每次提取之间固有的依赖关系。在公开数据集CaRB和Wire57上的实验表明,该方法比基线方法实现了更高的精度和召回率,F_(1)值提升了至少1.4%和3.2%,同时产生了更短、语义更丰富的提取。
-
关键词
开放域信息抽取
双仿射注意力
紧凑性
多头注意力
迭代抽取
-
Keywords
open information extraction(OpenIE)
biaffine attention
compactness
multi-head attention
iterative extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-