-
题名一种面向实体关系联合抽取中缓解曝光偏差的方法
- 1
-
-
作者
王震
范红杰
柳军飞
-
机构
北京大学软件与微电子学院
中国政法大学科学技术教学部
北京大学软件工程国家工程研究中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第9期1980-1992,共13页
-
基金
中国政法大学科研创新项目(21FQ41001)
中央高校基本科研业务费专项资金。
-
文摘
实体关系联合抽取的目的是从非结构化文本中同时提取实体提及和关系事实,是知识图构建的关键步骤,也是许多自然语言处理中高级任务的基础.现有工作大都采用了分阶段的联合抽取方法来处理文本中同时存在的多个三元组和实体重叠情况下的三元组抽取问题,虽然取得了合理的性能提升,但都存在严重的曝光偏差问题.对此,提出了一种名为融合关系表达向量(fusional relation expression embedding,FREE)的新方法,通过融合关系表达向量来有效缓解曝光偏差问题.此外,提出了一种称为条件层规范化层的新特征融合层来更有效地融合先验信息.在2个广泛使用的数据集上进行了大量对比实验,结果表明该方法相较于当前最先进的基线方法具有显著优势,可以更有效地处理各种情况,并在不牺牲效率的前提下取得了与当前针对曝光偏差问题的先进方法相当的性能.
-
关键词
联合抽取
曝光偏差
实体重叠三元组
融合关系表达向量
特征融合
-
Keywords
joint extraction
exposure bias
entity overlapped triplet
fusional relation expression embedding
feature fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-