-
题名面向新闻领域的中文实体关系抽取
被引量:1
- 1
-
-
作者
王博
王侃
王成刚
刘然
刘威鹏
黄慧荣
-
机构
北京信息技术研究所
中国西南电子技术研究所
西北工业大学网络空间安全学院
-
出处
《电讯技术》
北大核心
2021年第1期50-57,共8页
-
文摘
随着互联网技术的快速发展,人们能够及时地获取大量的新闻文本信息,如何从新闻中自动获取关键信息,把新闻中具有价值的信息转化为结构化数据,从而快速有效地获取有用的知识已是迫切需求。实体关系抽取是获取关键信息的方法之一,但目前关于中文的实体关系抽取工作较少。针对基于长短时记忆网络的中文实体识别模型难于提取长距离的依存关系特征和句法特征问题,提出利用双向树形长短时记忆神经网络提取依存句法树的结构特征。在提取的特征的基础上,使用条件随机场判断实体的类别和边界,并在实体识别模型中加入注意力机制提高模型的性能。在《人民日报》数据集和ACE 2005语料库上训练模型,验证了模型的有效性。
-
关键词
新闻文本信息
实体关系抽取
长短时记忆网络
最短依存路径
条件随机场
注意力机制
-
Keywords
news text information
entity relationship extraction
long-short-term memory neural network
shortest dependency path
conditional random field
attention mechanism
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名融入多特征的篇章级新闻要素关系抽取
被引量:1
- 2
-
-
作者
党雪云
王剑
-
机构
昆明理工大学信息工程与自动化学院
云南省人工智能重点实验室
-
出处
《电视技术》
2022年第6期73-78,共6页
-
基金
国家重点研发计划(No.2018YFC0830105
No.2018YFC0830101
No.2018YFC0830100)。
-
文摘
随着互联网信息技术高速更新迭代,新闻文本信息在以指数级的速度增多。面对海量的新闻文本信息,如何自动提取长篇新闻文本中要素与要素之间的关系,成为研究的重点。篇章级新闻要素关系抽取是指从篇章级新闻文本中跨句子识别要素之间的关系信息,有助于加速人们对整篇新闻文本脉络的理解。本文以舆情新闻文本为例,提出融入多特征的篇章级新闻要素关系抽取方法,通过异构图模型将句子间的邻接关系、从属关系、句法依赖关系、要素间的多跳关系等多种特征进行融合,充分挖掘文本中潜在的上下文信息。在构建的篇章级舆情新闻要素关系数据集上的实验结果表明,融入的多种特征对要素关系抽取的性能均有明显的提升,F1值最高提升了4.09%,较目前主流方法取得了更好的效果。
-
关键词
舆情新闻文本信息
篇章级要素关系抽取
异构图模型
-
Keywords
discourse-level element relation extraction
heterogeneous graph
public opinion news text information
-
分类号
TN931.3
[电子电信—信号与信息处理]
-