-
题名基于图预训练方法的事件抽取生成模型
- 1
-
-
作者
华玥莹
王中卿
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
北大核心
2025年第10期122-132,共11页
-
基金
国家自然科学基金(62076175,61976146)。
-
文摘
事件抽取是信息抽取领域的一个重要研究方向,旨在从非结构化文本中以结构化的形式呈现出事件各个方面的信息。现有方法通常将这一复杂任务分解为多个分类子任务来完成,但此类架构欠缺灵活性,且依赖大量细粒度的标注数据。为此该文提出一种统一的事件抽取生成模型,该模型将非结构化的文本序列转化成一棵结构化的事件树,以端到端的方式抽取所有事件信息。然而,现有的预训练语言模型在生成结构化数据时,微调任务与预训练任务的训练目标存在较大差距,这导致模型在生成结构化事件时性能受到限制。因此,该文提出一种联合文本序列和树形结构的自编码预训练方法,该方法联合处理输入文本序列和树形结构,统一了预训练和微调阶段的输入格式,并设计了多个预训练子任务以更好地建模结构化知识。在通用数据集ACE2005上的实验结果表明,该方法可有效提升事件抽取任务的性能。
-
关键词
事件抽取
生成模型
图预训练方法
-
Keywords
event extraction
generation-based model
graph pre-training
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-