-
题名两阶段问答范式的生物医学事件触发词检测
被引量:1
- 1
-
-
作者
行帅
熊玉洁
苏前敏
黄继汉
-
机构
上海工程技术大学电子电气工程学院
上海中医药大学药物临床研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第10期121-131,共11页
-
基金
上海市科技创新行动计划技术标准项目(21DZ2203100)
国家自然科学基金(62006150)。
-
文摘
现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%的F1分数,并在多个事件类型上的详细结果均优于其他基线模型。
-
关键词
生物医学事件
触发词检测
句法距离
单词-实体-事件共现特征
两阶段问答范式
-
Keywords
biomedical events
trigger detection
syntactic distance
word-entity-event co-occurrence feature
two-stage question answering paradigm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于CNN⁃BiGRU模型的事件触发词抽取方法
被引量:13
- 2
-
-
作者
苗佳
段跃兴
张月琴
张泽华
-
机构
太原理工大学信息与计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第9期69-74,83,共7页
-
基金
国家自然科学基金(61503273)。
-
文摘
传统事件触发词抽取方法在特征提取过程中对自然语言处理工具产生过度依赖的方法,耗费大量人力,容易出现错误传播和数据稀疏性等问题。为此,提出采用CNN-BiGRU模型进行事件触发词抽取的方法。将词向量和位置向量进行拼接作为输入,提取词级别特征和句子全局特征,提高触发词抽取效果,并通过CNN提取词汇级别特征,利用BiGRU获取文本上下文语义信息。在ACE2005英文语料库和中文突发事件语料库CEC上的实验结果表明,该模型事件触发词识别F1值分别达到74.9%和79.29%,有效提升事件触发词的抽取性能。
-
关键词
事件抽取
触发词检测
事件类型识别
卷积神经网络
循环神经网络
双向门控循环单元
特征提取
-
Keywords
event extraction
trigger word detection
event type recognition
Convolutional Neural Network(CNN)
Recurrent Neural Network(RNN)
Bidirectional Gated Recurrent Unit(BiGRU)
feature extraction
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于CRFs和跨事件的事件识别研究
被引量:12
- 3
-
-
作者
侯立斌
李培峰
朱巧明
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第24期191-195,共5页
-
基金
国家自然科学基金资助项目(60970056
61070123)
+1 种基金
江苏省自然科学基金资助项目(BK2008160)
高等学校博士学科点专项科研基金资助项目(20093201110006)
-
文摘
事件检测与类型识别是事件抽取的基础,具体实施分为触发词检测和事件类型识别2个阶段。分别对2个阶段进行研究,在前一阶段,针对词形特征过拟和问题,提出利用LDA模型对词语聚类的方法,考虑到中文自动分词与标注的触发词边界的不一致性,提出基于CRFs模型的触发词识别方法。在后一阶段,为提高事件类型识别的效果,将跨事件理论应用于中文事件类型识别。实验结果表明,该方法能提高系统性能,F值分别提高到66.3和62.0。
-
关键词
事件抽取
触发词检测
事件类型识别
跨事件
CRFs模型
LDA模型
-
Keywords
event extraction
trigger word detection
event type recognition
cross-event
CRFs model
LDA model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名否定信息识别研究综述
被引量:2
- 4
-
-
作者
唐凡
伍星
-
机构
重庆大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第12期1-8,共8页
-
基金
重庆市研究生科研创新项目(No.CYS15031)
-
文摘
自然语言中否定是一个普遍且复杂的现象,其能反转命题的真值、情感及态度的极性、观点的立场等。否定信息识别不仅在信息检索、情感分析、文本挖掘、信息抽取等领域中具有重要意义,也对文本的深层语义理解具有促进作用。对否定信息识别研究进行了深入分析,介绍了否定信息识别的任务框架,并对否定触发词检测、否定覆盖域界定、否定焦点识别三个子任务的解决思路及方法进行了详细阐述,最后总结并指出了否定信息识别研究中存在的问题及新方向。
-
关键词
否定信息
触发词检测
覆盖域界定
焦点识别
-
Keywords
negation
cues detection
scope resolution
focus detection
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-