期刊文献+
共找到85篇文章
< 1 2 5 >
每页显示 20 50 100
基于关系提示的单模块单步骤实体关系抽取方法研究
1
作者 刘辉 张智 王启源 《西安交通大学学报》 北大核心 2025年第3期222-234,共13页
针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层... 针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层次的关系语义信息和符号级和特征级的关系提示信息,对实体和关系提示符进行联合编码,得到统一的全局表示;同时通过注意力机制挖掘不同嵌入之间的深层关联,构建三重交互矩阵,可在一个步骤中直接从单个模块中提取所有三元组。结果表明:所提方法在NYT、WebNLG两个基准数据集上实现了最佳的表现,F_(1)分别达到了93.3%和94.9%。 展开更多
关键词 实体关系抽取 注意力机制 联合编码
在线阅读 下载PDF
基于片段排列和多头选择的实体识别与关系抽取联合模型
2
作者 陈雷 郑小盈 +1 位作者 祝永新 封松林 《计算机应用与软件》 北大核心 2025年第5期238-246,共9页
针对传统的信息抽取方法存在实体重叠、误差积累和依赖关系缺失等问题,该文提出一种基于片段排列和多头选择的实体识别与关系抽取联合模型。通过共享编码层来建立实体识别与关系抽取之间的依赖;通过片段排列的方式在span的层面解决实体... 针对传统的信息抽取方法存在实体重叠、误差积累和依赖关系缺失等问题,该文提出一种基于片段排列和多头选择的实体识别与关系抽取联合模型。通过共享编码层来建立实体识别与关系抽取之间的依赖;通过片段排列的方式在span的层面解决实体重叠问题;使用多头选择机制来预测实体之间的关系,并加入对抗训练,通过辅助损失函数进行约束。通过消融实验和基于不同权重损失函数的实验,找到了效果最好的参数。该模型在中文数据集DuIE 2.0上取得了F1值0.829的效果,相对于效果最好的基线模型提升2.24%。 展开更多
关键词 实体关系抽取 联合抽取 多头选择 片段排列模型
在线阅读 下载PDF
面向铜基复合材料文献的复杂实体关系抽取方法
3
作者 郭桦宜 游进国 +2 位作者 耿齐祁 陶静梅 易健宏 《计算机工程》 北大核心 2025年第11期100-111,共12页
从铜基复合材料文献中有效抽取实体和关系对构建材料知识图谱并推动材料科学研究有重要作用。由于该领域语料的实体构成复杂(如嵌套实体和非连续实体),且大量存在单实体重叠(SEO)关系,现有的实体关系抽取技术难以直接适用。为此,构建一... 从铜基复合材料文献中有效抽取实体和关系对构建材料知识图谱并推动材料科学研究有重要作用。由于该领域语料的实体构成复杂(如嵌套实体和非连续实体),且大量存在单实体重叠(SEO)关系,现有的实体关系抽取技术难以直接适用。为此,构建一个铜基复合材料实体关系抽取数据集,并提出一种两阶段实体关系抽取方法。第一阶段通过融合词间关系分类任务以及双向门控循环单元(BiGRU)和多粒度扩张卷积技术,提升了实体识别模型对实体跨度的识别能力。第二阶段在文本序列中标注实体信息,并在关系分类模型中引入实体类型注意力机制,以多特征表示来增强关系分类性能。在Matscholar、SOFC、MSP 3个公开数据集以及自建CBCM-IE数据集上的实验结果表明,该方法在精确率、召回率和F1值上相较基线方法平均有5.91、3.56和3.63百分点的提升,抽取性能较优。 展开更多
关键词 命名实体识别 关系抽取 预训练语言模型 铜基复合材料
在线阅读 下载PDF
基于实体关系联合抽取的装备RCMA知识图谱构建
4
作者 李云凯 任占勇 +1 位作者 贾治宇 苗强 《兵器装备工程学报》 北大核心 2025年第5期57-66,共10页
现有装备保障性分析工作还存在着一些挑战,例如对客观数据和历史数据利用不足、数据知识有效表征化程度不高以及无法进行知识推送等问题。而知识图谱是利用数据表示现实世界实体与关系的信息网络,是解决上述问题的有效方案。为了实现数... 现有装备保障性分析工作还存在着一些挑战,例如对客观数据和历史数据利用不足、数据知识有效表征化程度不高以及无法进行知识推送等问题。而知识图谱是利用数据表示现实世界实体与关系的信息网络,是解决上述问题的有效方案。为了实现数据驱动的装备以可靠性为中心的维修分析(RCMA),提出一种可以支撑保障性分析的装备RCMA知识图谱构建方法。首先,梳理装备RCMA流程,分析可以用于知识图谱的装备RCMA实体与关系,实现知识图谱的模式层构建。其次,通过单步骤-单模型的实体关系联合抽取方法,使用细粒度三分类模型OneRel从装备RCMA相关文本数据中抽取出三元组,实现知识图谱的数据层构建。最后,选用Neo4j图数据库进行存储,完成了装备RCMA知识图谱的构建。针对装备RCMA相关文本数据进行知识抽取实验,实验结果表明,使用实体关系联合模型的知识抽取在精确率上达到91%,比传统流水线方法用到的知识抽取模型精确率更高,且在构建流程上实现了优化。 展开更多
关键词 RCMA 保障性分析 知识图谱 实体关系联合抽取 深度学习
在线阅读 下载PDF
一种标签融合驱动的中文医疗实体关系抽取方法
5
作者 陈闯 张维彦 +1 位作者 阮彤 郑红 《华东理工大学学报(自然科学版)》 北大核心 2025年第2期260-269,共10页
医疗实体关系抽取是推动医疗信息化建设的关键步骤,旨在从医疗文本中抽取结构化的三元组信息。针对现有方法对实体类型标签和关系标签利用不充分的问题,提出了一种标签融合驱动的中文医疗实体关系抽取框架。首先,将实体关系抽取任务拆... 医疗实体关系抽取是推动医疗信息化建设的关键步骤,旨在从医疗文本中抽取结构化的三元组信息。针对现有方法对实体类型标签和关系标签利用不充分的问题,提出了一种标签融合驱动的中文医疗实体关系抽取框架。首先,将实体关系抽取任务拆分成双向的4个命名实体识别任务,并将每个任务的标签替换为头尾实体类型标签和关系标签的融合;其次,设计了三元组构造策略以最大限度利用双向抽取出的三元组;最后,利用三元组双向过滤模型筛选候选三元组。结果表明,该方法相较于GPLinker在F1指标上提升了3.01%。此外,该方法在医疗领域的重叠关系、多三元组和跨句三元组复杂场景中也表现出了优秀的性能。 展开更多
关键词 医疗文本 实体关系抽取 标签融合 双向抽取 三元组过滤模型
在线阅读 下载PDF
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:2
6
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于跨度表示的藏医药文献实体关系抽取
7
作者 周青 拥措 +1 位作者 拉毛东只 尼玛扎西 《北京大学学报(自然科学版)》 北大核心 2025年第5期860-868,共9页
针对由于藏医药术语的特殊性、文本资源的稀缺以及语言处理的复杂性,传统的实体关系抽取方法难以直接应用于藏医药领域的问题,提出一种基于跨度表示的藏医药文献实体关系抽取方法,该方法使用跨度表示和TibetanAI_ALBERT_v2.0预训练语言... 针对由于藏医药术语的特殊性、文本资源的稀缺以及语言处理的复杂性,传统的实体关系抽取方法难以直接应用于藏医药领域的问题,提出一种基于跨度表示的藏医药文献实体关系抽取方法,该方法使用跨度表示和TibetanAI_ALBERT_v2.0预训练语言模型进行编码,通过枚举潜在候选的实体,解决实体嵌套不能充分识别的问题。同时,引入KL散度来约束模型在训练和推理阶段不一致的问题。在藏医药领域实体关系抽取数据集TibetanAI_TMDisRE_v1.0上的实验结果表明,该方法取得显著的性能提升,精确率、召回率和F1值分别达到84.85%,77.35%和80.81%。 展开更多
关键词 藏文 藏医药 实体关系抽取 联合抽取
在线阅读 下载PDF
基于大语言模型的中文开放领域实体关系抽取策略
8
作者 龚永罡 陈舒汉 +3 位作者 廉小亲 李乾生 莫鸿铭 刘宏宇 《计算机应用》 北大核心 2025年第10期3121-3130,共10页
大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略... 大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略利用LLM优秀的语义理解和迁移学习能力,通过多轮不同任务的对话实现实体关系抽取。首先,基于开放领域文本结构化逻辑和思维链(CoT)机制,使用LLM生成结构化摘要,避免模型产生关系、事实幻觉和无法兼顾后文信息的问题;其次,通过文本简化策略并引入可替换词表,减少上下文窗口的限制;最后,基于结构化摘要和简化文本构建多级提示模板,使用LLaMA-2-70B模型探究参数temperature对实体关系抽取的影响。测试了LLaMA-2-70B在使用所提策略前后进行实体关系抽取的精准率、召回率、调和平均值(F1)和精确匹配(EM)值。实验结果表明,在CL-NE-DS、DiaKG和CCKS2021等5个不同领域的中文数据集上,所提策略提升了LLM在命名实体识别(NER)和关系抽取(RE)上的性能。特别是在专业性强且模型零样本测试结果不佳的DiaKG和IEPA数据集上,在应用所提策略后,相较于少样本提示测试,在NER上模型的精准率分别提升了9.3和6.7个百分点,EM值提升了2.7和2.2个百分点;在RE上模型的精准率分别提升了12.2和16.0个百分点,F1值分别提升了10.7和10.0个百分点。实验结果验证了所提策略能有效提升LLM实体关系抽取的效果并解决模型性能不稳定的问题。 展开更多
关键词 大语言模型 中文开放领域 命名实体识别 关系抽取 提示学习
在线阅读 下载PDF
基于记忆增强和跨度筛选的实体和关系联合抽取模型
9
作者 刘爽 罗桂君 孟佳娜 《计算机应用》 北大核心 2025年第11期3564-3572,共9页
实体和关系抽取(ERE)通常采用流水线的方式进行处理,但这种流水线方法仅依赖于前一个任务的输出,导致命名实体识别和关系抽取之间出现信息交互问题,且容易引发误差传播问题。针对以上问题,提出一种面向实体和关系抽取的记忆增强模型(MEE... 实体和关系抽取(ERE)通常采用流水线的方式进行处理,但这种流水线方法仅依赖于前一个任务的输出,导致命名实体识别和关系抽取之间出现信息交互问题,且容易引发误差传播问题。针对以上问题,提出一种面向实体和关系抽取的记忆增强模型(MEERE)。该模型引入类似记忆的机制,使每个任务不仅能利用前一任务的输出,还能反向影响前一任务,从而捕获实体和关系间的复杂交互。为进一步减轻误差传播,同时引入实体跨度筛选机制。该机制通过在联合模块中动态地筛选和验证实体跨度,确保只有高质量的实体被用于关系抽取,从而提升模型的鲁棒性和准确性。最后利用表格解码方式处理关系重叠问题。在3个广泛使用的基准数据集(ACE05、SciERC和CoNLL04)上的实验结果表明,MEERE在ERE任务上表现出了显著的优势。与Tab-Seq在CoNLL04数据集上相比,MEERE在命名实体识别和关系抽取上的性能都有显著提升,命名实体识别的F1值提升了0.5个百分点,关系严格评估的F1值提升了3.0个百分点;相较于PURE-F模型,MEERE实现了不少于9倍的加速效果,并且关系抽取性能更佳。这些结果验证了所提出的记忆增强模型在探索实体和关系交互作用方面的有效性。 展开更多
关键词 实体和关系联合抽取 记忆增强 跨度筛选 预训练语言模型 跨句子上下文
在线阅读 下载PDF
基于深度学习的医学实体和关系联合抽取研究综述 被引量:2
10
作者 叶青 张晓凤 +1 位作者 彭琳 程春雷 《计算机工程与应用》 CSCD 北大核心 2024年第24期65-78,共14页
命名实体识别与关系抽取作为医学领域信息抽取的核心任务,能够从非结构化或半结构化的文本中自动识别实体边界、实体类型以及实体之间的关系。不仅能够促进知识的发现与整合,应用于临床决策,加强药物的发现和再利用,还可以助力公共卫生... 命名实体识别与关系抽取作为医学领域信息抽取的核心任务,能够从非结构化或半结构化的文本中自动识别实体边界、实体类型以及实体之间的关系。不仅能够促进知识的发现与整合,应用于临床决策,加强药物的发现和再利用,还可以助力公共卫生监测和疾病预防。回顾了实体识别和关系抽取的发展历程,介绍了常用评价指标和医学领域实体关系联合抽取数据集,指出目前联合抽取领域存在医学文本结构比较复杂、实体关系重叠句子抽取率低等问题。根据这些问题,进一步探讨了基于深度学习的实体关系联合抽取方法在医学领域上的应用。这些方法根据模型解码的方式主要分为基于共享参数的联合抽取模型和基于联合解码的联合抽取模型,从问题解决角度对不同的模型的优缺点进行探讨分析和总结。讨论了医学领域实体关系抽取面临的挑战和未来的研究方向。 展开更多
关键词 医学文本 联合抽取 关系抽取 实体识别
在线阅读 下载PDF
基于ChatGLM和提示微调的旅游知识图谱构建 被引量:5
11
作者 徐春 苏明钰 孙彬 《科学技术与工程》 北大核心 2024年第31期13484-13492,共9页
为缓解旅游领域知识分散、信息碎片化的问题,提出一种基于ChatGLM(chat generative language model)和提示微调的实体关系抽取模型ChatGLM-ppt(ChatGLM with prompt and p-tuning)。该模型借助ChatGLM以对话形式完成实体关系抽取任务,... 为缓解旅游领域知识分散、信息碎片化的问题,提出一种基于ChatGLM(chat generative language model)和提示微调的实体关系抽取模型ChatGLM-ppt(ChatGLM with prompt and p-tuning)。该模型借助ChatGLM以对话形式完成实体关系抽取任务,并通过P-Tuning v2微调和添加提示模板的方法应对实体关系抽取中错误传播、实体冗余和关系重叠等问题。实验建立在自建的旅游领域数据集上,结果表明:在旅游领域实体关系抽取问题上ChatGLM-ppt模型F 1为92.19%,在处理重叠关系问题中F 1均大于90%,优于目前主流的实体关系抽取模型,证明该模型可有效提高实体关系抽取的准确率。进一步运用Neo4j图数据库构建旅游知识图谱,整合分散的旅游信息资源,对促进旅游业的数字化转型和智能化发展具有一定的参考意义。 展开更多
关键词 实体关系抽取 关系重叠 大语言模型 知识图谱
在线阅读 下载PDF
基于平行交互注意力网络的中文电子病历实体及关系联合抽取 被引量:3
12
作者 李丽双 王泽昊 +1 位作者 秦雪洋 袁光辉 《中文信息学报》 CSCD 北大核心 2024年第6期108-118,共11页
基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性... 基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性,在多个标准的医学和通用数据集上取得最优结果;当前中文医学实体及关系标注数据集较少,该文基于中文电子病历构建了实体和关系抽取数据集(CEMRIE),与医学专家共同制定了语料标注规范,并基于该文所提出的模型实验得出基准结果。 展开更多
关键词 实体关系联合抽取 双向特征交互模块 自注意力机制 中文电子病历 数据集标注与构建
在线阅读 下载PDF
基于对比学习与梯度惩罚的实体关系联合抽取模型 被引量:2
13
作者 张强 曾俊玮 陈锐 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1155-1162,共8页
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池... 针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取. 展开更多
关键词 实体关系抽取 对比学习 梯度惩罚 RoBERTa预训练模型 全局指针网络
在线阅读 下载PDF
基于深度字词融合的小麦种质信息实体关系联合抽取
14
作者 刘合兵 贾笑笑 +3 位作者 时雷 熊蜀峰 马新明 席磊 《计算机工程与设计》 北大核心 2024年第4期1079-1086,共8页
为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based ... 为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based on deep character and word fusion)。模型编码层通过深度字词融合和上下文语义特征融合,提高密集实体特征识别能力;模型三元组抽取层建立层叠指针网络,提高重叠关系的提取能力。在小麦种质数据集和公开数据集上的一系列对比实验结果表明,WGIE-DCWF模型能够有效提高小麦种质数据实体关系联合抽取效果,同时拥有较好的泛化性,可以为小麦种质信息知识库构建提供技术支撑。 展开更多
关键词 小麦种质信息 字词融合 实体关系抽取 联合抽取 层叠指针网络 实体识别 关系抽取
在线阅读 下载PDF
融合限定关系和交互信息的实体关系联合抽取模型
15
作者 唐瑞雪 秦永彬 陈艳平 《中文信息学报》 CSCD 北大核心 2024年第10期106-116,共11页
实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取... 实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取模型。该模型首先对句子进行关系预测,构成限定关系集。其次,利用限定关系分别地预测可能存在关系的头实体和尾实体,解决关系重叠问题,同时缓解冗余识别。为了加强句子中实体与关系的交互,利用注意力机制强化句子中关系有关信息,通过双仿射和卷积操作来构建评分矩阵。最后,通过评分矩阵对候选三元组进行校正,确定最终的关系三元组。实验结果表明,该模型在NYT和WebNLG数据集上F1值分别达到92.0%和88.7%,相比于所对比的基线模型F1值分别提高了2.8%和1.0%,验证了模型的有效性。 展开更多
关键词 实体关系抽取 联合抽取 重叠关系 限定关系 交互信息
在线阅读 下载PDF
基于潜在关系的实体关系联合抽取模型
16
作者 彭晏飞 张睿思 +1 位作者 王瑞华 郭家隆 《计算机科学与探索》 CSCD 北大核心 2024年第4期1047-1056,共10页
实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计... 实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计一种新的解码方式来减少预测过程中关系、实体和三元组的冗余信息,从整体上分为提取潜在实体对、解码关系两步来完成从句子中抽取三元组的任务。首先通过潜在实体对提取器预测实体间是否存在潜在关系,同时筛选出置信度高的实体对作为最终的潜在实体对;其次将关系解码视作多标签二分类任务,通过关系解码器预测每个潜在实体对之间全部关系的置信度;最后通过置信度确定关系数量和类型,以完成三元组的抽取任务。在两个通用数据集上的实验结果表明,所提模型相比基线模型在准确率和F1指标上的效果更好,验证了所提模型的有效性,消融实验也证明了模型内部各部分的有效性。 展开更多
关键词 实体关系联合抽取 潜在关系 潜在实体对 多标签二分类任务 信息冗余
在线阅读 下载PDF
基于实体级联类型的中文关系抽取管道模型
17
作者 饶东宁 吴倩梅 黄观琚 《计算机应用研究》 CSCD 北大核心 2024年第9期2685-2689,共5页
端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时... 端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时具有多个类型,这种多义性的情况在中文数据集中尤为常见。为解决上述问题,提出了一种实体级联类型机制,并在此基础上开发了一个更适合中文关系抽取的管道模型,取名为CENTRELINE。该流水线方法的实体模块是一个词-词关系分类模型,它以BERT和双向LSTM作为编码器、经过条件层归一化后引入空洞卷积,最后通过级联类型预测器输出实体及其级联类型。关系模块的输入仅由实体模块构建。该方法在DuIE1.0、DuIE2.0和CMeIE-V2数据集上的F_(1)值分别比基线方法提高了7.23、6.93和8.51百分点,并在DuIE1.0和DuIE2.0数据集上都实现了最先进的性能。消融实验表明,提出的级联类型机制和根据中文语言特征改进的管道模型,均对关系抽取性能具有明显的促进作用。 展开更多
关键词 中文关系抽取 管道模型 空洞卷积 实体级联类型
在线阅读 下载PDF
面向电力知识图谱构建的重叠实体关系联合抽取方法 被引量:7
18
作者 束嘉伟 杨挺 +1 位作者 耿毅男 于洁 《高电压技术》 EI CAS CSCD 北大核心 2024年第11期4912-4922,I0010,I0011,共13页
作为构建电力知识图谱的关键步骤,知识抽取可以从海量非结构化电力文本中准确抽取出实体和关系。但是,传统流水线式方法存在识别的错误信息后向传递、实体识别和关系抽取任务割裂以及易产生冗余信息的问题,进而导致抽取准确率低、抽取... 作为构建电力知识图谱的关键步骤,知识抽取可以从海量非结构化电力文本中准确抽取出实体和关系。但是,传统流水线式方法存在识别的错误信息后向传递、实体识别和关系抽取任务割裂以及易产生冗余信息的问题,进而导致抽取准确率低、抽取信息不全面,最终影响知识图谱的准确构建。针对上述问题,提出面向电力知识图谱构建的重叠实体关系联合抽取方法,通过改进的序列标注方案进行联合抽取,构建了电力领域专属预训练PowerRoberta模型,并增加对抗训练,提高了模型抽取电力知识的准确度和对陌生信息的预测能力。最后,以实际变电站巡检数据为例进行了实验分析与配电知识图谱可视化构建,结果表明所提出的联合抽取方法提升了知识抽取的准确率,准确率达到91.67%,可有效支撑配电网智能信息检索、辅助决策高级应用。 展开更多
关键词 自然语言处理 电力知识图谱 知识抽取 实体关系联合抽取 序列标注 关系重叠
在线阅读 下载PDF
基于异构图注意力网络的药物不良反应实体关系联合抽取研究 被引量:3
19
作者 仲雨乐 韩普 许鑫 《现代情报》 CSSCI 北大核心 2024年第9期71-81,共11页
[目的/意义]实体关系联合抽取是药物不良反应监测和知识组织的关键环节。为解决传统流水线抽取方法中误差传递、实体冗余和交互缺失问题,提升药物不良反应重叠三元组抽取效果,提出了一种基于异构图注意力网络的药物不良反应实体关系联... [目的/意义]实体关系联合抽取是药物不良反应监测和知识组织的关键环节。为解决传统流水线抽取方法中误差传递、实体冗余和交互缺失问题,提升药物不良反应重叠三元组抽取效果,提出了一种基于异构图注意力网络的药物不良反应实体关系联合抽取模型MF-HGAT。[方法/过程]首先通过BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;其次将关系信息作为先验知识引入为异构图节点,以避免提取语义无关实体;然后通过迭代融合异构图注意力网络消息传递机制增强字符与关系节点表示;最后在节点表示更新后抽取药物不良反应实体关系。[结果/结论]在自构建药物不良反应数据集上进行实验,发现融入关系信息和外部医疗健康领域知识的MF-HGAT联合抽取F1值达到了92.75%,较主流模型CasRel提升了5.29%。研究结果表明,MF-HGAT模型通过异构图注意力网络融合字符与关系节点语义,可有效解决药物不良反应实体关系重叠问题,对药物不良反应知识发现具有重要意义。 展开更多
关键词 异构图注意力网络 实体关系联合抽取 药物不良反应 关系重叠 知识发现
在线阅读 下载PDF
基于实体对注意力机制的实体关系联合抽取模型 被引量:2
20
作者 朱继召 赵一霖 +2 位作者 张家鑫 黄友澎 范纯龙 《中文信息学报》 CSCD 北大核心 2024年第2期99-108,共10页
实体关系抽取是实现海量文本数据知识化、自动构建大规模知识图谱的关键技术。考虑到头尾实体信息对关系抽取有重要影响,该文采用注意力机制将实体对信息融合到关系抽取过程中,提出了基于实体对注意力机制的实体关系联合抽取模型(EPSA)... 实体关系抽取是实现海量文本数据知识化、自动构建大规模知识图谱的关键技术。考虑到头尾实体信息对关系抽取有重要影响,该文采用注意力机制将实体对信息融合到关系抽取过程中,提出了基于实体对注意力机制的实体关系联合抽取模型(EPSA)。首先,使用双向长短时记忆网络(Bi-LSTM)结合条件随机场(CRF)完成实体的识别;其次,将抽取的实体配对,信息融合成统一的嵌入式表示形式,用于计算句子中各词的注意力值;然后,使用基于实体对注意力机制的句子编码模块得到句子表示,再利用显式融合实体对的信息得到增强型句子表示;最后,通过分类方式完成实体关系的抽取。在公开数据集NYT和WebNLG上对提出的EPSA模型进行评估,实现结果表明,与目前主流联合抽取模型相比,EPSA模型在F_(1)值上均得到提升,分别达到84.5%和88.5%,并解决了单一实体重叠问题。 展开更多
关键词 知识图谱 注意力机制 实体关系联合抽取
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部