期刊文献+

基于框架语义映射和类型感知的篇章事件抽取

Document-Level Event Extraction Based on Frame Semantic Mapping and Type Awareness
在线阅读 下载PDF
导出
摘要 篇章事件抽取任务从给定的文本中识别其事件类型和事件论元。该任务包括事件检测和论元识别两个子任务。目前篇章事件普遍存在数据稀疏和多值论元耦合的问题。基于此,该文提出了一种基于框架语义映射和类型感知的篇章事件抽取方法。该文分析发现事件描述与框架语义网有着相似的结构,因此将汉语框架网(CFN)与中文篇章事件建立映射,并在文本输入层引入触发词释义信息和滑窗机制充分感知上下文信息,改善了事件检测的数据稀疏问题;使用基于类型感知标签的多事件分离策略缓解了论元耦合问题。为了提升模型的鲁棒性,进一步引入对抗训练。在DuEE-fin和CCKS2021数据集上的实验结果显示,该文模型较当前主流模型测试结果有较大提升,验证了方法的有效性。 Document-Level event extraction,consisting of two subtasks of event detection and argument identification,identifies the event type and event arguments from a given text.This paper proposes a document-level event extraction method based on frame semantic mapping and type-awareness.To leverage the similar structure in frame semantic nets,a mapping is established between Chinese FrameNet(CFN)and Chinese text events.The trigger word interpretation information and the sliding window mechanism are introduced to fully perceive the context information in the text input layer.A multi-event separation strategy based on type-aware labels alleviates the problem of argument-coupling.In order to improve the robustness of the model,adversarial training is further introduced.Experimental results on DuEE-fin and CCKS2021 datasets show that the proposed method has a significant improved performance compared with the current mainstream models.
作者 卢江 苏雪峰 李茹 闫智超 陈加兴 LU Jiang;SU Xuefeng;LI Ru;YAN Zhichao;CHEN Jiaxing(School of Computer and Information Technology,Shanxi University,Taiyuan,Shanxi 030006,China;MOE Key Laboratory of Computational Intelligence and Chinese Information Processing,Shanxi University,Taiyuan,Shanxi 030006,China;School of Modern Logistics,Shanxi Vocational University of Engineering Science and Technology,Jinzhong,Shanxi 030609,China)
出处 《中文信息学报》 CSCD 北大核心 2024年第5期53-64,共12页 Journal of Chinese Information Processing
基金 国家自然科学基金(61936012) 山西省重点研发计划项目(202102020101008) 山西省基础研究计划(202203021211286)。
关键词 汉语框架网 框架语义映射 类型感知 事件抽取 Chinese FrameNet frame semantic mapping type awareness event extraction
作者简介 卢江(1997-),硕士研究生,主要研究领域为自然语言处理。E-mail:lujiangsxu@163.com;苏雪峰(1983-),博士研究生,主要研究领域为自然语言处理。E-mail:suexf@163.com;通信作者:李茹(1963-),博士,教授,主要研究领域为自然语言处理、信息检索。E-mail:liru@sxu.edu.cn。
  • 相关文献

参考文献2

二级参考文献26

  • 1张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量:34
  • 2赵军,金千里,徐波.面向文本检索的语义计算[J].计算机学报,2005,28(12):2068-2078. 被引量:28
  • 3杨思春.一种改进的句子相似度计算模型[J].电子科技大学学报,2006,35(6):956-959. 被引量:35
  • 4郝晓燕,刘伟,李茹,刘开瑛.汉语框架语义知识库及软件描述体系[J].中文信息学报,2007,21(5):96-100. 被引量:52
  • 5Lee M C. A novel sentence similarity measure for semantic-based expert systems [J]. Expert Systems with Applications, 2011, 38(5): 6392-6399.
  • 6穗志方,俞士汶.基于骨架依存树的语句相似度模型[C]//中文信息处理国际会议录.北京:清华大学出版社,1998:458-465.
  • 7Aliguliyev R M. A new sentence similarity measure and sentence based extractive technique for automatic text summarization [J]. Expert Systems with Applications, 2009,36(4): 7764-7772.
  • 8车万翔,刘挺,秦兵,等.面向双语句对检索的汉语句子相似度[C]//全国第七届计算语言学联合学术会议录.北京:清华大学出版社,2003.
  • 9董振东,董强.“知网”.1999[2011-08-20].http://www.keenage.com.
  • 10Miller G A, Beckwith R, Fellbaum C D, et al. WordNet: An online lexical database [J]. Int Journal of Lexicography, 1990, 3(4): 235-244.

共引文献53

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部