-
题名融合交互注意力网络的实体和关系联合抽取模型
被引量:1
- 1
-
-
作者
郝小芳
张超群
李晓翔
王大睿
-
机构
广西民族大学电子信息学院
广西民族大学人工智能学院
广西混杂计算与集成电路设计分析重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第8期156-164,共9页
-
基金
国家自然科学基金(62062011)
广西自然科学基金(2019GXNSFAA185017)
广西民族大学研究生科研创新项目(gxun-chxs2021066)。
-
文摘
实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实体和关系联合抽取模型RSIAN,该模型通过交互注意力网络来学习句子级别和关系级别的高阶语义关联,增强句子和关系之间的交互,辅助模型进行抽取决策。在构建的中文旅游数据集(TDDS)的Precision、Recall和F1值分别为0.872、0.760和0.812,其性能均优于其他对比模型;为了进一步验证该模型在英文联合抽取上的性能,在公开英文数据集NYT和Webnlg上进行实验,该模型的F1值相比基线模型RSAN模型分别提高了0.014和0.013,并且该模型在重叠三元组的分析实验也均取得了优于基线模型的性能且更稳定。
-
关键词
交互注意力网络
句子级别
关系级别
实体和关系联合抽取
注意力机制
重叠三元组
-
Keywords
interactive attention network
sentence-level
relationship-level
joint extraction model of entity and relation
attention mechanism
overlapping triple
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自然语言处理的产业链知识图谱构建
被引量:19
- 2
-
-
作者
毛瑞彬
朱菁
李爱文
周倚文
潘斌强
岳琳
-
机构
武汉大学信息资源研究中心
深圳证券信息有限公司
天津大学管理与经济学部
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2022年第3期287-299,共13页
-
基金
国家重点研发计划项目“亿级节点时序图谱实时智能分析关键技术与系统”课题五“金融时序知识图谱查询与分析平台及应用验证”(2020AAA0108505)。
-
文摘
产业链知识图谱在金融领域应用较为广泛,但目前多数研究是面向单一产业的知识图谱构建或面向产业竞争情报服务,并没有把产业链和知识图谱有机地结合起来。本文从产业链应用角度出发,对产业链知识图谱的构建方法进行研究。首先提出了产业链知识图谱的构建流程和本体库,再基于领域语言模型,实现知识分类、抽取、融合等金融领域文本处理方法,对海量的领域文本进行知识抽取和融合,最终成功构建产业链知识图谱。根据本文方法构建的产业链知识图谱系统,覆盖产业链78个,细分行业7629个,已经应用到投融资、监管和产业规划等多个重要场景中。
-
关键词
产业链
知识图谱
领域语言模型
实体和关系联合抽取
-
Keywords
industry chain
knowledge graph
domain language model
entity and relation joint extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
F124
[经济管理—世界经济]
-