-
题名限定域中文事件抽取研究综述
被引量:2
- 1
-
-
作者
李华昱
毕经纶
闫阳
-
机构
中国石油大学(华东)计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第18期43-58,共16页
-
基金
山东省自然科学基金(ZR2020MF140)。
-
文摘
事件抽取是信息抽取领域最具有挑战性的任务之一,也是知识图谱构建中的关键技术。事件抽取在阅读理解、文本摘要、问答系统等领域得到了广泛的应用。限定域事件抽取指的是系统所抽取的事件类型是预定义的,因此针对某一特定领域,限定域事件抽取的研究更具有研究价值,而且中文事件抽取由于中文语言特性问题,面临着较大挑战。介绍了中文事件抽取中面对的挑战,对限定域中文事件抽取的主要方法进行归纳总结,重点介绍了基于深度学习的方法,并总结了少样本情况下的事件抽取方法,介绍了中文事件抽取常用的数据集,展望了中文事件抽取未来的发展趋势。
-
关键词
限定域
中文事件抽取
信息抽取
-
Keywords
restricted domain
Chinese event extraction
information extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名机器阅读理解式中文事件抽取方法
被引量:3
- 2
-
-
作者
吴旭
卞文强
颉夏青
孙利娟
-
机构
北京邮电大学网络空间安全学院
北京邮电大学可信分布式计算与服务教育部重点实验室
北京邮电大学图书馆
北京邮电大学经济管理学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第16期93-100,共8页
-
基金
国家自然科学基金(62072488)
2017北京市教工委网络舆情信息编报(700300184)。
-
文摘
事件抽取是信息抽取的重要任务之一,在知识图谱构建、金融行业分析、内容安全分析等领域均有重要应用。现有中文事件抽取方法一般为实体识别、关系抽取、实体分类等任务的级联。将事件抽取转化为阅读理解任务,可为模型引入问题所含的先验信息。提出一种基于预训练模型的机器阅读理解式中文事件抽取方法(Chinese event extraction by machine reading comprehension,CEEMRC),将中文事件抽取简化为两个问答模型的级联。首先对事件触发词抽取、事件类型判定、属性抽取构建相应的问答任务问题。以RoBERTa为基础构建触发词抽取和事件类型识别联合模型、事件属性抽取两个问答模型,并融入触发词先验特征、分词信息、触发词相对位置等信息来提升模型效果。最后以模型预测回答的起始和结束位置完成所需的抽取。实验使用DuEE中文事件数据集,触发词抽取和属性抽取的F1值均优于同类方法,验证了该方法的有效性。
-
关键词
机器阅读理解
问答任务
预训练模型
中文事件抽取
-
Keywords
machine reading comprehension
question answering tasks
pre-training model
Chinese event extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于句法语义依存分析的中文金融事件抽取
被引量:31
- 3
-
-
作者
万齐智
万常选
胡蓉
刘德喜
-
机构
江西财经大学信息管理学院
江西财经大学软件与物联网工程学院
江西财经大学数据与知识工程江西省高校重点实验室
-
出处
《计算机学报》
EI
CSCD
北大核心
2021年第3期508-530,共23页
-
基金
国家自然科学基金项目(61972184,61562032,61762042)
江西省教育厅科学技术研究项目(GJJ180198,GJJ180252)资助。
-
文摘
事件抽取在自然语言处理应用中扮演着重要的角色,如股票市场趋势预测.传统事件抽取较为关注触发词和论元所属类型的正确性,较少地结合应用需求去分析研究事件抽取效果及使用价值.在财经领域,事件作用对象及动作是关注的重点.因此,本文聚焦于金融事件,抽取三元组事件ET(Sub,Pred,Obj).在中文财经新闻中,存在大量事件嵌套和成分共享等现象,致使易出现事件漏抽和事件成分缺失的情况.为了解决这些问题,本文建立一个句法和语义依存分析相结合的中文事件抽取框架,归纳了4种常见缺省结构,并设计相应的补全规则.首先,基于句法依存树,分析动词词法和句法结构,建立核心动词链,使得每个核心动词对应一个事件,解决事件漏抽问题.然后,在句法依存树的基础上添加语义依存关系,建立事件间语义关联,得到句法语义依存分析(Syntactic Semantic Dependency Parsing,SSDP)树.第三,调整SSDP树,优化句法结构,形成SSDP图,使得同等句法结构的词结点处于相同层级,为后续事件抽取提供途径.第四,归纳4种常见缺省结构,设计相应补全规则,解决事件成分缺失问题.最后,在中文财经新闻标题和CoNLL2009中文语料上进行详细的实验测试,实验结果表明该方法是有效的.
-
关键词
中文事件抽取
核心动词链
句法语义依存分析图
事件语义关联
缺省补全
-
Keywords
Chinese event extraction
core verb chain
syntactic semantic dependency parsing graph
event semantics relevance
default complement
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-