期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于模块交互和依存关系的生物医学事件检测
1
作者 张勇 左皓阳 +1 位作者 苏莹 周光有 《中文信息学报》 北大核心 2025年第6期119-126,共8页
该文提出一种基于模块交互和依存关系的生物医学事件检测模型。该模型在事件检测模块中融入了命名实体识别模块与图卷积策略,充分利用数据集中的标注信息和远距离依存关系来提高文本的语义表示。该模型同时构造了一个命名实体识别模块... 该文提出一种基于模块交互和依存关系的生物医学事件检测模型。该模型在事件检测模块中融入了命名实体识别模块与图卷积策略,充分利用数据集中的标注信息和远距离依存关系来提高文本的语义表示。该模型同时构造了一个命名实体识别模块和一个事件检测模块,并将命名实体识别模块中训练的语义特征拼接到事件检测模块,以增强事件检测的语义信息。同时,该模型还在事件检测模块中集成了基于门控机制的图卷积层,以利用依存句法信息来提高单词之间远距离依存关系的建模能力。在生物医学事件检测数据集上的实验结果显示,该模型的F_(1)值达到了81.63%,整体性能优于其他模型,显示了模块交互与图卷积策略在提升生物医学事件检测方面的有效性。 展开更多
关键词 生物医学事件检测 模块交互 命名实体识别 图卷积
在线阅读 下载PDF
基于混合神经网络和注意力机制的生物医学事件触发词识别方法
2
作者 任永功 林禹竹 +2 位作者 唐玉洁 于博 何馨宇 《电子学报》 EI CAS CSCD 北大核心 2024年第9期3206-3216,共11页
生物医学事件作为生物医学文本挖掘的重要组成部分,在生物医学研究和疾病的预防中发挥着重要作用.触发词识别是生物医学事件抽取的关键和前提步骤,旨在提取描述事件类型的关键词.传统方法在特征提取过程中过分依赖自然语言处理工具,导... 生物医学事件作为生物医学文本挖掘的重要组成部分,在生物医学研究和疾病的预防中发挥着重要作用.触发词识别是生物医学事件抽取的关键和前提步骤,旨在提取描述事件类型的关键词.传统方法在特征提取过程中过分依赖自然语言处理工具,导致耗费人工成本.另外,由于生物医学文献的特殊性—长文本语句多,导致长距离依赖问题比较明显.为了解决这些问题,我们提出了一种混合结构,由残差卷积神经网络和双向长短期神经网络、混合神经网络和多头注意力机制组成.该模型利用残差卷积神经网络提取单词级特征并利用双向长短期神经网络提取上下文语义信息.此外,本文通过空间域滑动窗口将长句划分为等长短句,在不破坏上下文信息的前提下,避免了长距离依赖.实验结果表明,本文提出的方法在生物医学事件抽取通用语料MLEE(Multi-Level Event Extraction)上取得了较好的效果,F值达到81.15%. 展开更多
关键词 生物医学事件抽取 触发词识别 ReCNN-BiLSTM 空间域滑动窗口 MUH-Attention机制 混合神经网络
在线阅读 下载PDF
两阶段问答范式的生物医学事件触发词检测 被引量:1
3
作者 行帅 熊玉洁 +1 位作者 苏前敏 黄继汉 《计算机工程与应用》 CSCD 北大核心 2024年第10期121-131,共11页
现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识... 现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%的F1分数,并在多个事件类型上的详细结果均优于其他基线模型。 展开更多
关键词 生物医学事件 触发词检测 句法距离 单词-实体-事件共现特征 两阶段问答范式
在线阅读 下载PDF
融合外部知识和图卷积神经网络的生物医学事件联合识别 被引量:2
4
作者 杨书鸿 牛玥 刘力铭 《科学技术与工程》 北大核心 2024年第22期9464-9473,共10页
利用自然语言处理技术从生物医学文本中抽取药物治疗、疾病诊断等事件以及事件中涉及的疾病、药物等实体,对于生物医学领域相关学术研究以及各类生物医学应用系统具有重要意义。针对生物医学文本中的缩略词及专业术语难以识别和生物医... 利用自然语言处理技术从生物医学文本中抽取药物治疗、疾病诊断等事件以及事件中涉及的疾病、药物等实体,对于生物医学领域相关学术研究以及各类生物医学应用系统具有重要意义。针对生物医学文本中的缩略词及专业术语难以识别和生物医学语义关系难以嵌入的问题,提出了一种融合外部知识和图卷积神经网络的生物医学信息联合识别模型。图卷积神经网络构建了包含实体和语义关系的异构图,能够迭代地融合本地知识图和外部知识图中的交互信息,根据得到的交互信息来进行生物医学实体对之间关系的抽取任务。预训练编码后利用图卷积神经网络构建本地和外部知识两个知识图,获得两个图中每个节点的特征表示,并且通过注意力实体链接的方法将两个图进行融合与信息迭代,进而抽取其最后一层隐藏层来完成最终的分类识别。其中统一医学语言系统(unified medical language system,UMLS)被用作实体消歧的外部知识库,实体链接器根据注意力权重选择对应实体。通过在MLEE语料库上进行的实验表明,联合任务能够实现事件抽取和触发词、元素识别的综合性能。 展开更多
关键词 生物医学事件抽取 外部知识库 生物医学实体链接 图卷积神经网络
在线阅读 下载PDF
基于深层语境词表示与自注意力的生物医学事件抽取 被引量:3
5
作者 魏优 刘茂福 胡慧君 《计算机工程与科学》 CSCD 北大核心 2020年第9期1670-1679,共10页
生物医学事件抽取是生物医学文本信息抽取中最重要的、也是最富有挑战性的任务之一,近年来得到了广泛关注。生物医学事件抽取中最重要的2个子任务为触发词识别和事件要素检测。已有的大部分方法将触发词识别作为分类任务,忽略了句子级... 生物医学事件抽取是生物医学文本信息抽取中最重要的、也是最富有挑战性的任务之一,近年来得到了广泛关注。生物医学事件抽取中最重要的2个子任务为触发词识别和事件要素检测。已有的大部分方法将触发词识别作为分类任务,忽略了句子级标签信息。构建基于长短时记忆神经网络与条件随机场的序列标注模型用于触发词识别,分别将组合字符级词表示的静态预训练词向量和基于预训练语言模型的动态语境词表示作为模型输入;同时,针对事件要素检测任务,充分利用实体以及实体类型特征,提出基于自注意力的多分类模型。最终触发词识别F1值为81.65%,整体事件抽取F1值为60.04%,实验结果表明提出的方法对于生物医学事件抽取是有效的。 展开更多
关键词 生物医学事件抽取 序列标注 语境词表示 自注意力
在线阅读 下载PDF
基于可控解码策略的生成式生物医学事件抽取 被引量:1
6
作者 苏方方 李霏 姬东鸿 《中文信息学报》 CSCD 北大核心 2023年第11期68-80,共13页
该文在预训练语言模型T5的框架基础上构建了一个生成式生物医学事件抽取模型,该方法可以自由定义输出序列,由此可以联合建模触发词识别、关系抽取和论元组合三个子任务。模型采用了生成序列字典树和事件类型-论元角色字典树,用于规范序... 该文在预训练语言模型T5的框架基础上构建了一个生成式生物医学事件抽取模型,该方法可以自由定义输出序列,由此可以联合建模触发词识别、关系抽取和论元组合三个子任务。模型采用了生成序列字典树和事件类型-论元角色字典树,用于规范序列生成和减少论元角色的搜索空间。另外还采用可控解码策略便于限制每一步生成时所使用的候选词汇集,最后在训练时使用了课程学习,便于T5模型熟悉生物医学语料和有层次结构的完整事件的学习。该文模型在Genia 2011年和Genia 2013年的语料上分别获得了62.40%和54.85%的F1值,说明了使用生成式的方式进行生物医学事件抽取是可行的。 展开更多
关键词 生物医学事件抽取 生成式模型 可控解码策略
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部