-
题名基于CRFs和跨事件的事件识别研究
被引量:12
- 1
-
-
作者
侯立斌
李培峰
朱巧明
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第24期191-195,共5页
-
基金
国家自然科学基金资助项目(60970056
61070123)
+1 种基金
江苏省自然科学基金资助项目(BK2008160)
高等学校博士学科点专项科研基金资助项目(20093201110006)
-
文摘
事件检测与类型识别是事件抽取的基础,具体实施分为触发词检测和事件类型识别2个阶段。分别对2个阶段进行研究,在前一阶段,针对词形特征过拟和问题,提出利用LDA模型对词语聚类的方法,考虑到中文自动分词与标注的触发词边界的不一致性,提出基于CRFs模型的触发词识别方法。在后一阶段,为提高事件类型识别的效果,将跨事件理论应用于中文事件类型识别。实验结果表明,该方法能提高系统性能,F值分别提高到66.3和62.0。
-
关键词
事件抽取
触发词检测
事件类型识别
跨事件
CRFs模型
LDA模型
-
Keywords
event extraction
trigger word detection
event type recognition
cross-event
CRFs model
LDA model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于跨事件理论的缺失事件角色填充研究
被引量:5
- 2
-
-
作者
侯立斌
李培峰
朱巧明
钱培德
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2012年第7期200-204,共5页
-
基金
国家自然科学基金(90920004
60970056
+2 种基金
61070123
61003153)
江苏省高校自然科学重大基础研究项目(08KJA520002)资助
-
文摘
事件抽取是信息抽取领域的研究热点。针对ACE事件抽取局限于当前单个句子而造成大量事件论元角色缺失的现象,提出了基于跨事件的缺失事件角色填充理论并实现了原型系统。系统分为缺失角色填充识别和缺失角色填充分类两个部分,识别部分用于判定缺失角色是否可被填充,分类部分用于从其它事件描述中选择合适的角色(实体)对可被填充的缺失角色进行填充。对ACE2005语料进行了后期标注,实验中两个阶段的F值分别达到72.97和74.68。
-
关键词
角色填充
跨事件
事件抽取
-
Keywords
Filling of missing event argument,Cross-event inference, Event extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向汉越跨语言事件检索的事件预训练方法
- 3
-
-
作者
吴少扬
余正涛
黄于欣
朱恩昌
高盛祥
邓同杰
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2024年第4期78-85,共8页
-
基金
国家自然科学基金(U21B2027,61972186,61732005,61866019)
云南省重大科技专项(202002AD080001,202202AD080003,202103AA080015)
云南省高新技术产业专项(201606)。
-
文摘
汉越跨语言事件检索是用汉语查询检索越南语事件新闻的任务。由于越南语属于典型的低资源语言,汉越跨语言事件检索缺乏大规模的标注数据,并且现有的跨语言预训练模型无法很好地表征文本中丰富的汉越对齐事件知识,不适用于该任务。因此,为了将汉越双语对齐的事件知识融入到多语言预训练语言模型中,该文提出了两个预训练方法,即事件要素掩码预训练以及跨语言事件对比预训练。在该文构造的汉越跨语言事件检索数据集和公开跨语言问答数据集上进行了实验,比基线提升1%~3%MAP值,2%~4%NDCG值,证明了该文方法的有效性。
-
关键词
事件预训练
跨语言事件检索
掩码语言模型
对比学习
-
Keywords
event pre-training
cross-lingual event retrieval
masked language model
contrastive learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于要素关联图的汉越跨语言事件检索方法
- 4
-
-
作者
赵周颖
余正涛
黄于欣
陈瑞清
朱恩昌
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《现代电子技术》
北大核心
2024年第7期127-132,共6页
-
文摘
汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪声文本,现有的模型不能很好地捕获事件匹配特征,匹配效果欠佳。基于此,文中提出基于要素关联图的汉越跨语言事件检索方法。首先,预训练一个汉越双语词嵌入来解决跨语言问题;然后,抽取查询文档中的关键信息(关键词和实体)以构建要素关联图;最后,通过引入一个图编码器对构建的要素图进行编码,生成结构化的事件信息来增强传统的事件检索模型。实验结果表明文中提出的方法优于传统的基线方法。
-
关键词
跨语言事件检索
跨语言词嵌入
要素关联图
图神经网络
文本匹配
事件检索
-
Keywords
cross⁃lingual event retrieval
cross⁃lingual word embedding
arguments relational graph
graph neural network
text match
fact retrieval
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名事件抽取综述
被引量:16
- 5
-
-
作者
马春明
李秀红
李哲
王惠茹
杨丹
-
机构
新疆大学信息科学与工程学院
香港理工大学电子及资讯工程学系
-
出处
《计算机应用》
CSCD
北大核心
2022年第10期2975-2989,共15页
-
基金
国家语委科研重点项目(ZDI135-96)。
-
文摘
将用户感兴趣的事件从非结构化信息中提取出来,然后以结构化的方式展示给用户,这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发,事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集,而不同的事件表示方法也与事件抽取研究有一定联系;以任务类型区分,元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中,元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式,而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果,而跨语言事件抽取依然面临着许多问题。最后,总结了事件抽取的相关工作并提出未来研究方向,以期为后续研究提供参考。
-
关键词
事件抽取
事件表示
元事件抽取
主题事件抽取
跨语言事件抽取
-
Keywords
event extraction
event representation
meta-event extraction
subject event extraction
cross-language event extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-