期刊文献+
共找到273篇文章
< 1 2 14 >
每页显示 20 50 100
基于深度学习的篇章级事件抽取综述
1
作者 胡蓉 万常选 +2 位作者 万齐智 刘德喜 刘喜平 《计算机学报》 北大核心 2025年第2期381-406,共26页
篇章级事件抽取是自然语言处理的重要任务且富有挑战,当前涌现了很多优秀的研究成果。尽管国内外存在少量篇章级事件抽取综述,但存在一些局限:(1)按文献采用的具体技术或任务实现步骤对现有研究成果进行分类,未深入分析现有研究成果间... 篇章级事件抽取是自然语言处理的重要任务且富有挑战,当前涌现了很多优秀的研究成果。尽管国内外存在少量篇章级事件抽取综述,但存在一些局限:(1)按文献采用的具体技术或任务实现步骤对现有研究成果进行分类,未深入分析现有研究成果间的关联与区别,未深刻理解现有研究成果分别致力于解决哪些问题;(2)简单介绍现有数据集,未能正确认识每个数据集的特点及带来的任务挑战。由于每个数据集侧重点不同,研究者们致力于解决不同的问题,因此现有梳理方式未能清晰地展示不同数据集下不同研究问题的研究进展。为此,本文重新梳理篇章级事件抽取的2个(子)任务的研究成果。首先,针对2个任务,分别明确任务目标,分析解决任务的基本思路,总结现有研究进展(基于哪些数据集解决了哪些问题)。然后,总结对应数据集的特点,归纳任务面临的挑战,再深入分析具体研究方法,并图示化展示推进情况。最后,结合有待继续攻破的问题,讨论篇章级事件抽取未来发展趋势。 展开更多
关键词 篇章级事件抽取 信息抽取 事件抽取数据集 事件论元抽取 深度学习
在线阅读 下载PDF
一种注意力引导知识增强的事件因果关系识别方法
2
作者 徐博 孙晋辰 +1 位作者 林鸿飞 宗林林 《中文信息学报》 北大核心 2025年第1期89-100,共12页
事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT... 事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT模型对事件对及其上下文进行编码;然后,提出零跳混合匹配方案挖掘事件相关的描述型知识和关系型知识,通过注意力机制对事件的描述型知识序列进行编码,通过稠密图神经网络对事件对的关系型知识进行编码。最后,融合前三个编码模块识别事件因果关系。基于EventStoryLine和Causal-TimeBank数据集的实验结果表明,该文所构建模型的识别效果优于现有模型,在零跳概念匹配、描述性和关系型知识编码等层面均获得了识别性能的提升。 展开更多
关键词 事件抽取 因果识别 知识图谱 注意力机制 自然语言处理
在线阅读 下载PDF
预训练多池注意力模型的事件论元抽取
3
作者 周晓磊 梁宇龙 +1 位作者 郭锐锋 张炜 《小型微型计算机系统》 北大核心 2025年第5期1064-1071,共8页
事件论元抽取任务在专业领域中,缺乏标注数据资源且数据标注成本高,导致任务性能在处理同类实体的主客体表达时表现糟糕.本文提出了一种方法,将多池注意力机制与预训练模型相结合建模为以机器问答为框架的提取任务.通过采用预训练编码... 事件论元抽取任务在专业领域中,缺乏标注数据资源且数据标注成本高,导致任务性能在处理同类实体的主客体表达时表现糟糕.本文提出了一种方法,将多池注意力机制与预训练模型相结合建模为以机器问答为框架的提取任务.通过采用预训练编码的多维池化表示,捕获了句子和局部上下文特征,解决了在参数提取过程中准确识别事件主体和对象的问题,又增强了模型在资源约束下的性能.通过与具有相似参数量级的预训练问答模型进行性能比较,本文方法显示出更高的评测性能.这证实了本文方法在资源受限的情况下的有效性. 展开更多
关键词 事件抽取 注意力机制 机器问答 预训练 多池化
在线阅读 下载PDF
基于因果事件抽取驱动关键法律要素感知的林法类案检索模型构建
4
作者 田萱 谢格云 吴志超 《农业机械学报》 北大核心 2025年第8期411-418,446,共9页
林法类案检索旨在找到与输入案例事实相似的历史林法判决案例,在林业智能法律系统中发挥着核心作用。现有的类案检索模型缺乏对法律案文特定结构内关键法律要素的考虑,无法准确利用关键法律要素蕴含的深层语义信息,导致在相似候选案例... 林法类案检索旨在找到与输入案例事实相似的历史林法判决案例,在林业智能法律系统中发挥着核心作用。现有的类案检索模型缺乏对法律案文特定结构内关键法律要素的考虑,无法准确利用关键法律要素蕴含的深层语义信息,导致在相似候选案例的检索场景中表现欠佳。在林业法律案文中,关键法律要素通常出现在以林木为主体的因果事件中,为此,提出一种因果事件抽取驱动关键法律要素感知的林法类案检索模型(Causal event extraction-driven key legal element-aware model,CEKLE),该模型在将法律案文拆分为“前言”、“事实”、“分析”、“判决”和“尾文”5部分基础上,重点关注林业法律案文的“事实”与“分析”2部分,结合因果事件抽取,获取相应因果事件,从而准确感知案例关键法律要素位置,充分挖掘关键法律语义信息,以提升林法类案检索准确性。2个数据集上的实验结果表明,在林法类案检索中CEKLE优于最先进的基线模型。 展开更多
关键词 林法类案检索 关键法律要素 结构划分 因果事件抽取
在线阅读 下载PDF
基于深度学习的事件特征提取与舆情反转预测 被引量:2
5
作者 王楠 杜豪 +2 位作者 谭舒孺 李海荣 姜家慧 《情报杂志》 北大核心 2025年第3期107-118,共12页
[研究目的]针对目前舆情事件特征构建存在的问题,考虑事件文本差异性,挖掘更加准确合理的事件深层特征,并用于网络舆情反转预测。[研究方法]基于注意力机制和Transformer等深度学习方法构建了一个事件特征提取模型Doc2EV:对于事件描述文... [研究目的]针对目前舆情事件特征构建存在的问题,考虑事件文本差异性,挖掘更加准确合理的事件深层特征,并用于网络舆情反转预测。[研究方法]基于注意力机制和Transformer等深度学习方法构建了一个事件特征提取模型Doc2EV:对于事件描述文本,提出基于等级掩码注意力的事件描述特征提取模型HMA_EV,生成事件描述特征;对于事件评论文本,使用最新的事件评论特征提取模型NL2ER-Transformer,生成事件评论特征;将提取的事件描述特征和事件评论特征进行融合,生成完整的事件特征并用于舆情反转预测。[研究结果/结论]研究表明,基于Doc2EV模型生成的事件特征向量在舆情反转预测任务上取得97.83%的准确率,高于其它基线模型组合。等级掩码注意力机制有利于捕捉不同平台、不同事件文本之间的关联性和重要性,有利于提取到关键性的事件描述特征;不同事件文本特征适用不同特征提取器进行提取,融合后的事件特征更全面准确;Doc2EV模型能够很好地实现舆情反转预测任务。 展开更多
关键词 舆情事件 舆情反转预测 深度学习 等级掩码注意力 事件特征提取 异质平台 Doc2EV
在线阅读 下载PDF
多任务增强的文本生成式事件要素抽取方法
6
作者 史张龙 周喜 +2 位作者 王震 马博 杨雅婷 《计算机工程与应用》 北大核心 2025年第9期168-176,共9页
事件要素抽取旨在从非结构化文本中抽取结构化的事件数据,为下游任务提供结构化输入。近年来,许多研究采用预训练语言模型加提示学习的方式实现事件要素抽取,以模板槽位填空的形式完成该任务。然而,以往的研究主要采用单模板单任务的方... 事件要素抽取旨在从非结构化文本中抽取结构化的事件数据,为下游任务提供结构化输入。近年来,许多研究采用预训练语言模型加提示学习的方式实现事件要素抽取,以模板槽位填空的形式完成该任务。然而,以往的研究主要采用单模板单任务的方法,但单一模板难以很好地捕捉事件要素实体间的结构依赖关系,其设计质量会影响最终的抽取结果;并且忽视了在进行多任务学习时,相似任务之间的促进作用。因此,设计了一种基于多任务增强的文本生成式事件要素抽取方法。具体地,分别构建了多模板指令增强任务模块与跨任务协同增强任务模块,以生成式模型作为共享主干网络,多种任务统一训练实现知识高效共享。该方法通过不同模板的指令增强,加强额外语义约束,提高了模型对指令的理解能力,通过跨任务的协同增强,使模型通过不同任务的互相监督,提高了模型对事件文本的理解分析能力。在ACE05数据集和RAMS数据集上的全样本实验中,该方法的Arg-C值分别达到了74.1%和52.4%,达到了最优水平。同时具有优异的少样本性能,在少样本场景下实验,仅需一半的数据量就可以达到阅读理解方法的抽取效果。 展开更多
关键词 事件要素抽取 信息抽取 提示学习 多任务学习 自然语言处理
在线阅读 下载PDF
动态异构图增强的级联解码事件抽取
7
作者 郭新宇 马博 +2 位作者 艾比布拉•阿塔伍拉 杨奉毅 周喜 《计算机工程》 北大核心 2025年第9期91-100,共10页
事件抽取是一项重要的信息抽取任务,旨在从自然语言文本中抽取出特定的事件或事实信息。在现实事件抽取场景中存在大量的事件重叠问题,即一个单词可以同时作为不同事件类型的触发词或不同角色的事件论元。然而,现有重叠事件抽取方法忽... 事件抽取是一项重要的信息抽取任务,旨在从自然语言文本中抽取出特定的事件或事实信息。在现实事件抽取场景中存在大量的事件重叠问题,即一个单词可以同时作为不同事件类型的触发词或不同角色的事件论元。然而,现有重叠事件抽取方法忽略了事件类型、论元角色等事件元素之间的关联和依赖关系,导致重叠事件抽取性能不佳。针对此问题,提出一种动态异构图增强的级联解码事件抽取模型DHG-EE,通过多粒度级联解码结构与领域-事件类型-论元角色异构图网络,有效实现重叠事件的结构表示与事件元素间的信息传递。具体来说:首先采用预训练模型对自然语言文本进行编码并构建由领域、事件类型和论元角色组成的多粒度异构图网络,将重叠事件论元与对应的多个领域节点和事件类型节点分开,并通过异构图的动态点边结构高效表示重叠事件的复杂关联关系;然后多粒度级联解码结构按照语义粒度由粗到细依次解码领域属性、事件类型、事件触发词和事件论元,并将上一粒度信息作为额外信息辅助下一粒度的解码,通过粗粒度领域和事件类型的预解码,有效约束了细粒度重叠触发词和事件论元的解码。实验结果表明,该模型在FewFC和DuEE1.0基准事件抽取数据集上的F1值优于对比的基线模型。 展开更多
关键词 信息抽取 事件抽取 重叠事件 异构图网络 级联解码
在线阅读 下载PDF
基于时频特征和机器学习的小震级地震事件类型识别
8
作者 李雪颜 边银菊 +2 位作者 侯晓琳 王婷婷 张艺潇 《地震学报》 北大核心 2025年第4期594-609,共16页
针对华北地区小震级(M_(L)≤3.0)地震事件,利用K-近邻算法(KNN)、自适应提升算法(AdaBoost)和轻量级梯度提升机算法(LGBM)对天然地震、人工爆破以及矿震塌陷事件进行类型识别。首先对地震事件波形记录和时频谱进行分析,提取时间、P波与... 针对华北地区小震级(M_(L)≤3.0)地震事件,利用K-近邻算法(KNN)、自适应提升算法(AdaBoost)和轻量级梯度提升机算法(LGBM)对天然地震、人工爆破以及矿震塌陷事件进行类型识别。首先对地震事件波形记录和时频谱进行分析,提取时间、P波与S波振幅比、频率、过零率、峰值振幅、峰值加速度、能量、信号、角度及其它比值等10个类别的62个特征,并将这些特征作为分类的基础;然后采用三种分类算法分别对二分类任务和三分类任务进行模型训练;最后对测试数据的类型进行识别。结果显示:所有分类模型的识别准确率均达90.0%以上,其中LGBM的综合性能最强,AdaBoost次之;不同分类任务中天然地震与矿震的分类模型表现最佳。 展开更多
关键词 天然地震 非天然地震事件 特征提取 地震事件分类
在线阅读 下载PDF
结合二维增强融合机制的事件论元抽取方法
9
作者 王潞翔 陈艳平 +2 位作者 黄辉 黄瑞章 秦永彬 《计算机工程与应用》 北大核心 2025年第10期111-119,共9页
针对现有的事件论元抽取研究中触发词和论元间缺少交互以及通道内部缺少交互的问题,提出结合二维增强融合机制的事件论元抽取模型(two-dimensional enhanced fusion mechanism for event argument extraction,W2-ARG)。在句子中的触发... 针对现有的事件论元抽取研究中触发词和论元间缺少交互以及通道内部缺少交互的问题,提出结合二维增强融合机制的事件论元抽取模型(two-dimensional enhanced fusion mechanism for event argument extraction,W2-ARG)。在句子中的触发词两边插入标识符,引入事件类型信息的同时增强触发词和论元的交互,并单独编码触发词以突出其在句子中的语义信息。将论元抽取建模为二维化表示的标签预测,通过膨胀卷积捕获不同距离的单词的语义交互。使用通道注意力模块增强通道内部的交互,以强化通道内的信息传递。最后利用拉普拉斯算子来突出事件论元在语义空间中的位置特征,提升模型对事件论元的识别精度。模型在ACE05-EN、ERE-EN数据集上进行了实验,实验结果表明该方法的性能相较其他基于分类的事件论元抽取方法提升明显。 展开更多
关键词 事件论元抽取 句子平面化表示 通道注意力 拉普拉斯算子 BERT
在线阅读 下载PDF
基于细粒度图文对齐的多模态事件抽取方法
10
作者 曹健威 孙英杰 +2 位作者 李凌寒 曾维新 胡艳丽 《火力与指挥控制》 北大核心 2025年第4期135-140,149,共7页
多模态事件抽取旨在从图文数据中抽取结构化的多模态事件信息,其核心在于克服不同模态数据之间的差异,并建立跨模态的关联。提出一种基于细粒度图文对齐的多模态事件抽取方法,由单模态信息抽取和多模态信息融合两个阶段组成。利用文本... 多模态事件抽取旨在从图文数据中抽取结构化的多模态事件信息,其核心在于克服不同模态数据之间的差异,并建立跨模态的关联。提出一种基于细粒度图文对齐的多模态事件抽取方法,由单模态信息抽取和多模态信息融合两个阶段组成。利用文本事件抽取和视觉实体抽取模型获取细粒度的单模态事件信息;基于多模态预训练模型进行细粒度图文对齐,得到多模态事件信息。在多模态事件抽取数据集上进行实验,验证了方法的有效性。 展开更多
关键词 多模态事件抽取 图文对齐 多模态预训练模型 信息抽取 事件抽取
在线阅读 下载PDF
融合混合提示与位置感知的突发事件抽取模型
11
作者 郭嘉梁 王巍 +1 位作者 剧京 王亚飞 《计算机应用研究》 北大核心 2025年第6期1771-1777,共7页
突发事件抽取任务旨在从突发事件新闻报道中检测并提取出所蕴涵的事件类型及其事件要素,该任务为公共安全和应急响应提供了详细和结构化的信息。针对突发事件抽取领域内文本数据稀疏导致的上下文信息忽视问题,提出了一种基于上下文增强... 突发事件抽取任务旨在从突发事件新闻报道中检测并提取出所蕴涵的事件类型及其事件要素,该任务为公共安全和应急响应提供了详细和结构化的信息。针对突发事件抽取领域内文本数据稀疏导致的上下文信息忽视问题,提出了一种基于上下文增强混合提示模板与位置感知注意力机制的突发事件抽取模型。首先,设计了上下文增强混合提示模板,在输入文本中添加任务相关的提示,以提升模型对任务的理解和推理能力。进而提出了位置感知注意力机制,从前向和后向两个方向捕捉关键的语义信息,以解决传统注意力机制对称性限制的问题。在中文突发事件语料库上的实验结果显示,提出的方法在事件类型检测和事件要素抽取任务上的F 1值分别达到了91.8%和82.0%。 展开更多
关键词 突发事件 事件抽取 事件要素识别 提示学习 注意力机制
在线阅读 下载PDF
基于压缩感知的非侵入式负荷监测
12
作者 袁博 葛少云 +3 位作者 刘洪 冯喜春 刘国平 魏孟举 《中国电机工程学报》 北大核心 2025年第3期1205-1218,I0034,共15页
压缩感知(compressed sensing,CS)具有压缩简单、更适用于监测环境等特点,成为电网中解决监测数据海量化问题的重要方式,但其在非侵入式负荷监测(non-intrusive load monitoring,NILM)中的应用研究尚未真正开展。为适应传统NILM中时空... 压缩感知(compressed sensing,CS)具有压缩简单、更适用于监测环境等特点,成为电网中解决监测数据海量化问题的重要方式,但其在非侵入式负荷监测(non-intrusive load monitoring,NILM)中的应用研究尚未真正开展。为适应传统NILM中时空密集采集、高频信息采集等需求,该文首次深入探索基于压缩感知的非侵入式负荷监测方法。首先,分析负荷原始信号及其特征值的类型,证明NILM中的CS可用性;然后,分别基于场景识别、数学优化模型和事件探测,提出3种基于CS的NILM框架及其实现流程;在此基础上,针对框架中需要解决的关键问题,提出适用的特征提取方法、事件探测方法、数学优化模型、CS三要素设计的具体流程。实验表明,该文提出的3种框架及其关键问题解决方法均具有合理性,负荷识别准确率均接近90%、负荷分解准确率达92%以上、重构信噪比大于70 dB,满足相关领域要求。 展开更多
关键词 压缩感知 基本框架 事件探测 特征提取 数学模型 可用性证明 CS三要素
在线阅读 下载PDF
基于机器阅读理解的中文事件论元抽取方法
13
作者 马文杰 吴家帆 +2 位作者 陶建华 杨国花 张大伟 《中文信息学报》 北大核心 2025年第5期102-109,共8页
事件抽取任务旨在从文本中抽取出事件信息,包含事件类型检测和事件论元抽取两个子任务。目前的中文事件论元抽取方法存在着如下问题:(1)两段式论元抽取方法中存在误差累积;(2)现有模型在嵌套实体以及多实体抽取场景上表现较差;(3)现有... 事件抽取任务旨在从文本中抽取出事件信息,包含事件类型检测和事件论元抽取两个子任务。目前的中文事件论元抽取方法存在着如下问题:(1)两段式论元抽取方法中存在误差累积;(2)现有模型在嵌套实体以及多实体抽取场景上表现较差;(3)现有方法主要聚焦于抽取预先定义的样本类型事件,且比较依赖训练数据,因此对于新的以及样本极少的事件类型抽取效果较差。针对上述问题,该文将中文事件论元抽取任务重构为机器阅读理解任务,有效地缓解了上述误差累积、嵌套实体、多论元实体抽取效率低的问题。实验证明,该种建模方式能够有效地利用预训练语言模型的优势及事件类型等先验信息,具有很好的泛化性能,并且能很好地推广到新事件类型的论元角色的识别中。 展开更多
关键词 事件论元抽取 机器阅读理解 预训练语言模型
在线阅读 下载PDF
基于本体模型的事件抽取及图谱构建方法
14
作者 刘旭波 任海洋 +1 位作者 刘敬蜀 张学军 《电讯技术》 北大核心 2025年第9期1397-1403,共7页
针对事件间隐藏关系难挖掘、开放域语义歧义多、可解释性差等问题,提出了一种基于本体模型的事件抽取及图谱构建方法。通过本体引导事件抽取,构建得到事件知识图谱,形成包含实体、事件、关系抽取任务的多任务端到端联合抽取框架,实现事... 针对事件间隐藏关系难挖掘、开放域语义歧义多、可解释性差等问题,提出了一种基于本体模型的事件抽取及图谱构建方法。通过本体引导事件抽取,构建得到事件知识图谱,形成包含实体、事件、关系抽取任务的多任务端到端联合抽取框架,实现事件关系推理分析。仿真实验结果表明,该方法能够有效提高事件关系推理的精确率和召回率。 展开更多
关键词 事件关系推理 本体模型 事件抽取 知识图谱
在线阅读 下载PDF
融合事件类型的中文事件抽取方法 被引量:1
15
作者 王瑾睿 李劼 《计算机工程与应用》 北大核心 2025年第1期214-220,共7页
事件抽取技术是自动化地从文本信息中获得结构性数据的重要手段,也是自然语言处理领域的重点研究方向之一。事件抽取包含两个子任务,事件类型检测与事件论元抽取。近年来的事件抽取研究引入了预训练语言模型作为文本的语义表征,然后采... 事件抽取技术是自动化地从文本信息中获得结构性数据的重要手段,也是自然语言处理领域的重点研究方向之一。事件抽取包含两个子任务,事件类型检测与事件论元抽取。近年来的事件抽取研究引入了预训练语言模型作为文本的语义表征,然后采用序列标注BIO完成抽取任务,但此类方法容易存在标签歧义问题。因此又有学者提出在事件文本特征中融入特征知识以避免歧义,可现有的融合方法忽略了事件抽取各个子任务间的依赖关系。为解决以上问题,针对事件抽取任务采用联合学习的算法框架,通过门融合机制将事件类型信息作为新知识融入事件的文本表示中,再进行事件触发词抽取与事件论元抽取。实验结果证明该算法模型在论元抽取任务上较之基线方法表现更优异。 展开更多
关键词 文本事件抽取 预训练语言模型 门融合
在线阅读 下载PDF
基于LLM的等级保护事件抽取方法
16
作者 王浩宇 贾克斌 谭琛瀚 《计算机工程与设计》 北大核心 2025年第11期3292-3299,共8页
大语言模型在自然语言处理任务中取得了重要进展,为提高等级保护2.0语料的易读性与结构化表示,提出一个预训练后优化微调的事件抽取模型CPEE-LLM。模型基于Baichuan2-7B进行等级保护语料冻结预训练,随后构建事件抽取数据集CPEED。设计一... 大语言模型在自然语言处理任务中取得了重要进展,为提高等级保护2.0语料的易读性与结构化表示,提出一个预训练后优化微调的事件抽取模型CPEE-LLM。模型基于Baichuan2-7B进行等级保护语料冻结预训练,随后构建事件抽取数据集CPEED。设计一种ChatGPT-4o提示词续写方法,生成增强数据集CPEED-ext。为优化模型效果,提出一种结果优化双重微调方法:使用ChatGPT对模型生成结果与人工抽取结果进行评估,优化数据集后再微调。实验结果显示模型在事件抽取任务中的F1值达97.7%,非等保语料剔除率达98.3%,GPT评分优于公开大模型,显著提升了等级保护语料的信息抽取效率与精准度。 展开更多
关键词 大语言模型 网络安全等级保护 事件抽取 事件抽取数据集 预训练 LoRA微调 结果评估双重微调
在线阅读 下载PDF
语义信息提取和图结构挖掘的事件骨架生成方法
17
作者 黄凯 马廷淮 +3 位作者 孙圣杰 龚智恒 汤毅翔 陈思 《计算机工程与应用》 北大核心 2025年第12期187-195,共9页
事件骨架生成旨在从一系列的事件图中归纳出包含事件类型及其时序关系的事件骨架图。这是在时间复杂事件模式归纳任务中的一个核心步骤。尽管现有的方法在这项任务上已经取得了一定的效果,但是由于事件图的复杂性和多变性,这些方法在挖... 事件骨架生成旨在从一系列的事件图中归纳出包含事件类型及其时序关系的事件骨架图。这是在时间复杂事件模式归纳任务中的一个核心步骤。尽管现有的方法在这项任务上已经取得了一定的效果,但是由于事件图的复杂性和多变性,这些方法在挖掘事件图的结构信息和语义信息方面仍显不足。因此,为解决该问题,提出了一种事件骨架生成模型。在图编码阶段,模型使用了拉普拉斯位置编码,以精准捕捉和编码图结构的局部信息。同时,模型采用了多头注意力机制和图卷积网络,以提取语义信息和图结构信息,全面总结事件发展的全局结构信息,构建出更泛化、更全面的事件骨架图。实验证明,在事件骨架生成任务上,该模型在Event Match指标上提升了8.83%,Event Sequence Match指标上提升了11.2%(L=2)和7.6%(L=3),实现了较大的性能提升。 展开更多
关键词 事件模式归纳 事件骨架生成 图生成 语义信息提取 图结构挖掘
在线阅读 下载PDF
融合预训练模型与注意力的事件抽取方法 被引量:1
18
作者 肖立中 殷晨旭 《计算机工程与应用》 北大核心 2025年第4期130-140,共11页
事件抽取旨在从大量无结构的文本中抽取出结构化的事件信息,然而现有的研究工作存在难以抽取重叠角色,子任务间缺乏交互以及语义特征表达能力不足的问题。针对上述问题提出了一种中文事件抽取模型PACJEE(pre-trained language model and... 事件抽取旨在从大量无结构的文本中抽取出结构化的事件信息,然而现有的研究工作存在难以抽取重叠角色,子任务间缺乏交互以及语义特征表达能力不足的问题。针对上述问题提出了一种中文事件抽取模型PACJEE(pre-trained language model and attention mechanism based Chinese joint event extraction)。该模型采用预训练语言模型RoBERTa来提取文本特征,对文本进行事件类型分类,在触发词识别阶段,将提取到的事件类型先验特征与文本特征进行融合,并且使用自注意力机制获取内部特征相关性,在论元角色分类阶段引入卷积神经网络与注意力机制来加强触发词特征的表达能力,通过多层指针标注进行重叠角色的识别。该方法在中文数据集ACE2005和DuEE上进行了实验分析,结果显示,相较于基准方法,在触发词分类上的F1值分别提升1.6和0.5个百分点,在论元角色分类上的F1值分别提升3.3和2.5个百分点,说明该模型能显著提升事件抽取效果,并且在一定程度上提升了对角色重叠事件的识别准确率。 展开更多
关键词 事件抽取 角色重叠 特征融合 注意力机制
在线阅读 下载PDF
融合旋转式位置编码与图递归检索方法的书院事件抽取研究
19
作者 喻雪寒 何琳 《大学图书馆学报》 北大核心 2025年第2期50-65,共16页
书院是我国古代独特的教育机构,而《中国书院辞典》作为记载书院的重要资料,收纳自唐代至清代全国有史可考的书院多达1600余所。为全面、系统地整理与提取有效数据,文章在对事件抽取各类模式与方法综述的基础上,探索出综合旋转式位置编... 书院是我国古代独特的教育机构,而《中国书院辞典》作为记载书院的重要资料,收纳自唐代至清代全国有史可考的书院多达1600余所。为全面、系统地整理与提取有效数据,文章在对事件抽取各类模式与方法综述的基础上,探索出综合旋转式位置编码与图递归检索的方法以抽取书院的事件信息:利用RoFormerV2模型对绝对位置进行编码,使每个向量附带相对位置信息,之后借助全局归一化思想通过嵌套实体识别模型GlobalPointer和完全子图搜索方式递归查找事件类型与论元。在《中国书院辞典》上进行的实验表明,该方法能有效融合向量的位置和语义信息并对论元间的关联性进行建模,克服了长文本引发的信息缺失与事件论元的嵌套问题,并具备良好的外推性。 展开更多
关键词 中国书院辞典 事件抽取 RoFormerV2 GlobalPointer 图递归检索
在线阅读 下载PDF
面向战略运筹分析的事件本体及数据集构建方法
20
作者 陈泉林 贾珺 《系统仿真学报》 北大核心 2025年第4期943-952,共10页
针对战略运筹分析领域缺少信息抽取技术研究的专业数据集的问题,提出一种面向战略运筹分析的事件本体及数据集构建方法。根据战略运筹分析中情况判断方面的需求,提出面向战略运筹分析事件本体模型,并使用“少量人工标注+微调大语言模型... 针对战略运筹分析领域缺少信息抽取技术研究的专业数据集的问题,提出一种面向战略运筹分析的事件本体及数据集构建方法。根据战略运筹分析中情况判断方面的需求,提出面向战略运筹分析事件本体模型,并使用“少量人工标注+微调大语言模型标注”的方法构建面向战略运筹分析的事件数据集EfSOA。数据集构建方法以及EfSOA突出了战略运筹分析领域知识,能有效支持信息抽取方法在该领域的研究,为未来构建面向战略运筹分析的事件抽取与关系挖掘模型提供方法。 展开更多
关键词 战略运筹分析 大语言模型 事件本体 数据集 信息抽取
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部