-
题名基于原型的正负学习用于远程监督关系抽取
- 1
-
-
作者
徐国梁
陈祺东
徐宇璇
-
机构
南京信息工程大学计算机学院、网络空间安全学院
无锡学院物联网工程学院
江南大学人工智能与计算机学院
-
出处
《电子测量技术》
北大核心
2025年第15期91-100,共10页
-
文摘
基于多示例学习框架的远程监督关系抽取方法大多依赖于启发式生成的污染标签,侧重于在句袋级别进行关系预测。然而,这些方法在句子级别的预测中表现不佳,而句子级别的预测更适用于理解性任务,如问答和知识图谱补全。为解决上述问题,本文提出了一种新型的远程监督关系抽取方法,该方法通过正负学习在句子级别训练模型,以区分噪声数据并加速收敛。同时,构建了一个约束图,用于编码关系与实体类型之间的约束,并通过辅助损失向关系原型优化,从而实现不同关系之间的信息传播,使得模型能够学习到更为本质且可解释的句子表示。本文方法不仅能够识别噪声数据,还可以通过迭代修正其标签,以改进远程数据的质量,进一步提高模型性能。本方法在NYT数据集的句子级关系抽取任务中表现出色,精确度达77.69%,较当前最优基准模型提升6.47%,在噪声标注测试集上的F1分数高达85.88%,验证了其卓越的去噪能力。消融实验结果表明,约束图对关系原型优化的贡献为11.02%。实验结果表明,该方法在句子级别的关系抽取任务中显著优于现有方法,不仅有效减少了噪声影响,还显著提升了模型性能,为远程监督关系抽取任务提供了一个高效的解决方案。
-
关键词
远程监督关系提取
正负学习
原型表示
句子级别关系抽取
噪声过滤
-
Keywords
distant supervision relation extraction
positive and negative learning
prototypical representation
sentence-level relation extraction
noise filtering
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TN911.4
[电子电信—通信与信息系统]
-