期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
基于片段排列和多头选择的实体识别与关系抽取联合模型
1
作者 陈雷 郑小盈 +1 位作者 祝永新 封松林 《计算机应用与软件》 北大核心 2025年第5期238-246,共9页
针对传统的信息抽取方法存在实体重叠、误差积累和依赖关系缺失等问题,该文提出一种基于片段排列和多头选择的实体识别与关系抽取联合模型。通过共享编码层来建立实体识别与关系抽取之间的依赖;通过片段排列的方式在span的层面解决实体... 针对传统的信息抽取方法存在实体重叠、误差积累和依赖关系缺失等问题,该文提出一种基于片段排列和多头选择的实体识别与关系抽取联合模型。通过共享编码层来建立实体识别与关系抽取之间的依赖;通过片段排列的方式在span的层面解决实体重叠问题;使用多头选择机制来预测实体之间的关系,并加入对抗训练,通过辅助损失函数进行约束。通过消融实验和基于不同权重损失函数的实验,找到了效果最好的参数。该模型在中文数据集DuIE 2.0上取得了F1值0.829的效果,相对于效果最好的基线模型提升2.24%。 展开更多
关键词 实体关系抽取 联合抽取 多头选择 片段排列模型
在线阅读 下载PDF
基于实体关系联合抽取的装备RCMA知识图谱构建
2
作者 李云凯 任占勇 +1 位作者 贾治宇 苗强 《兵器装备工程学报》 北大核心 2025年第5期57-66,共10页
现有装备保障性分析工作还存在着一些挑战,例如对客观数据和历史数据利用不足、数据知识有效表征化程度不高以及无法进行知识推送等问题。而知识图谱是利用数据表示现实世界实体与关系的信息网络,是解决上述问题的有效方案。为了实现数... 现有装备保障性分析工作还存在着一些挑战,例如对客观数据和历史数据利用不足、数据知识有效表征化程度不高以及无法进行知识推送等问题。而知识图谱是利用数据表示现实世界实体与关系的信息网络,是解决上述问题的有效方案。为了实现数据驱动的装备以可靠性为中心的维修分析(RCMA),提出一种可以支撑保障性分析的装备RCMA知识图谱构建方法。首先,梳理装备RCMA流程,分析可以用于知识图谱的装备RCMA实体与关系,实现知识图谱的模式层构建。其次,通过单步骤-单模型的实体关系联合抽取方法,使用细粒度三分类模型OneRel从装备RCMA相关文本数据中抽取出三元组,实现知识图谱的数据层构建。最后,选用Neo4j图数据库进行存储,完成了装备RCMA知识图谱的构建。针对装备RCMA相关文本数据进行知识抽取实验,实验结果表明,使用实体关系联合模型的知识抽取在精确率上达到91%,比传统流水线方法用到的知识抽取模型精确率更高,且在构建流程上实现了优化。 展开更多
关键词 RCMA 保障性分析 知识图谱 实体关系联合抽取 深度学习
在线阅读 下载PDF
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:2
3
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于并联残差膨胀卷积网络的短文本实体关系联合抽取
4
作者 曾伟 奚雪峰 崔志明 《现代电子技术》 北大核心 2025年第2期169-178,共10页
关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题... 关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题。为此,文中提出一种基于并联残差膨胀卷积网络的短文本实体关系联合抽取方法。该方法利用BERT生成语义特征信息,采用并联残差膨胀卷积网络来捕获语义信息,从而提升上下文信息的捕获能力并缓解噪声。联合抽取框架通过抽取潜在关系来过滤无关关系,然后再抽取实体以预测三元组,从而解决关系冗余和重叠问题,并提高计算效率。实验结果表明,与现有的主流模型相比,所提模型在三个公共数据集NYT、WebNLG和DuIE上的F1值分别为90.9%、91.3%和73.5%,相较于基线模型均有提升,验证了该模型的有效性。 展开更多
关键词 实体关系抽取 短文本 残差膨胀卷积网络 语义特征 联合抽取 BERT编码器
在线阅读 下载PDF
基于对比学习与梯度惩罚的实体关系联合抽取模型 被引量:2
5
作者 张强 曾俊玮 陈锐 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1155-1162,共8页
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池... 针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取. 展开更多
关键词 实体关系抽取 对比学习 梯度惩罚 RoBERTa预训练模型 全局指针网络
在线阅读 下载PDF
基于大语言模型的实体关系抽取综述 被引量:1
6
作者 夏江镧 李艳玲 葛凤培 《计算机科学与探索》 北大核心 2025年第7期1681-1698,共18页
实体关系抽取任务旨在从非结构化文本中识别实体对及其相互关系,是众多自然语言处理下游任务应用的基础。随着大数据和深度学习技术的发展,实体关系抽取的研究取得了显著进展。近年来,将大语言模型应用于实体关系抽取任务已成为新的研... 实体关系抽取任务旨在从非结构化文本中识别实体对及其相互关系,是众多自然语言处理下游任务应用的基础。随着大数据和深度学习技术的发展,实体关系抽取的研究取得了显著进展。近年来,将大语言模型应用于实体关系抽取任务已成为新的研究趋势。大语言模型具备自动特征提取和强大的泛化能力,能够显著提升任务性能。对实体关系抽取的方法进行综述,并根据所使用的方法和模型的演变将其划分为两大类。介绍了命名实体识别和关系抽取任务的定义。系统回顾了实体关系抽取方法的发展历程,并对其相应模型的优缺点进行了深入分析。在此基础上,重点探讨了基于大语言模型的方法在解决实体关系抽取任务中的独特优势。整理了当前主流数据集的特点,并总结了实体关系抽取任务的常用评价指标,如精确率、召回率和F1值等。分析了当前研究中存在的挑战并对未来研究方向进行了展望。 展开更多
关键词 大语言模型 实体关系抽取 命名实体识别
在线阅读 下载PDF
基于大语言模型的中文开放领域实体关系抽取策略
7
作者 龚永罡 陈舒汉 +3 位作者 廉小亲 李乾生 莫鸿铭 刘宏宇 《计算机应用》 北大核心 2025年第10期3121-3130,共10页
大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略... 大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略利用LLM优秀的语义理解和迁移学习能力,通过多轮不同任务的对话实现实体关系抽取。首先,基于开放领域文本结构化逻辑和思维链(CoT)机制,使用LLM生成结构化摘要,避免模型产生关系、事实幻觉和无法兼顾后文信息的问题;其次,通过文本简化策略并引入可替换词表,减少上下文窗口的限制;最后,基于结构化摘要和简化文本构建多级提示模板,使用LLaMA-2-70B模型探究参数temperature对实体关系抽取的影响。测试了LLaMA-2-70B在使用所提策略前后进行实体关系抽取的精准率、召回率、调和平均值(F1)和精确匹配(EM)值。实验结果表明,在CL-NE-DS、DiaKG和CCKS2021等5个不同领域的中文数据集上,所提策略提升了LLM在命名实体识别(NER)和关系抽取(RE)上的性能。特别是在专业性强且模型零样本测试结果不佳的DiaKG和IEPA数据集上,在应用所提策略后,相较于少样本提示测试,在NER上模型的精准率分别提升了9.3和6.7个百分点,EM值提升了2.7和2.2个百分点;在RE上模型的精准率分别提升了12.2和16.0个百分点,F1值分别提升了10.7和10.0个百分点。实验结果验证了所提策略能有效提升LLM实体关系抽取的效果并解决模型性能不稳定的问题。 展开更多
关键词 大语言模型 中文开放领域 命名实体识别 关系抽取 提示学习
在线阅读 下载PDF
基于预训练大语言模型的实体关系抽取框架及其应用 被引量:1
8
作者 魏伟 金成功 +3 位作者 杨龙 周默 孟祥主 冯慧 《应用科学学报》 北大核心 2025年第1期20-34,共15页
实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环... 实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环经济政策进行了实体关系抽取研究。基于所提出的PLLM-RE框架,首先使用RoBERTa模型进行循环经济政策文本的实体识别,然后选取基于Transformer的双向编码器表示(bidirectional encoder representation from Transformers, BERT)模型进行循环经济政策实体关系抽取研究,以构建该政策领域的知识图谱。研究结果表明,PLLM-RE框架在循环经济政策实体关系抽取任务上的性能优于对比模型BiLSTM-ATT、PCNN、BERT以及ALBERT,验证了所提框架在循环经济政策实体关系抽取任务上的适配性和优越性,为后续循环经济领域资源的信息挖掘和政策分析提供了新思路。 展开更多
关键词 预训练大语言模型 实体关系抽取框架 循环经济政策 政策分析
在线阅读 下载PDF
融合限定关系和交互信息的实体关系联合抽取模型
9
作者 唐瑞雪 秦永彬 陈艳平 《中文信息学报》 CSCD 北大核心 2024年第10期106-116,共11页
实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取... 实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取模型。该模型首先对句子进行关系预测,构成限定关系集。其次,利用限定关系分别地预测可能存在关系的头实体和尾实体,解决关系重叠问题,同时缓解冗余识别。为了加强句子中实体与关系的交互,利用注意力机制强化句子中关系有关信息,通过双仿射和卷积操作来构建评分矩阵。最后,通过评分矩阵对候选三元组进行校正,确定最终的关系三元组。实验结果表明,该模型在NYT和WebNLG数据集上F1值分别达到92.0%和88.7%,相比于所对比的基线模型F1值分别提高了2.8%和1.0%,验证了模型的有效性。 展开更多
关键词 实体关系抽取 联合抽取 重叠关系 限定关系 交互信息
在线阅读 下载PDF
基于潜在关系的实体关系联合抽取模型
10
作者 彭晏飞 张睿思 +1 位作者 王瑞华 郭家隆 《计算机科学与探索》 CSCD 北大核心 2024年第4期1047-1056,共10页
实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计... 实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计一种新的解码方式来减少预测过程中关系、实体和三元组的冗余信息,从整体上分为提取潜在实体对、解码关系两步来完成从句子中抽取三元组的任务。首先通过潜在实体对提取器预测实体间是否存在潜在关系,同时筛选出置信度高的实体对作为最终的潜在实体对;其次将关系解码视作多标签二分类任务,通过关系解码器预测每个潜在实体对之间全部关系的置信度;最后通过置信度确定关系数量和类型,以完成三元组的抽取任务。在两个通用数据集上的实验结果表明,所提模型相比基线模型在准确率和F1指标上的效果更好,验证了所提模型的有效性,消融实验也证明了模型内部各部分的有效性。 展开更多
关键词 实体关系联合抽取 潜在关系 潜在实体 多标签二分类任务 信息冗余
在线阅读 下载PDF
基于实体对注意力机制的实体关系联合抽取模型 被引量:2
11
作者 朱继召 赵一霖 +2 位作者 张家鑫 黄友澎 范纯龙 《中文信息学报》 CSCD 北大核心 2024年第2期99-108,共10页
实体关系抽取是实现海量文本数据知识化、自动构建大规模知识图谱的关键技术。考虑到头尾实体信息对关系抽取有重要影响,该文采用注意力机制将实体对信息融合到关系抽取过程中,提出了基于实体对注意力机制的实体关系联合抽取模型(EPSA)... 实体关系抽取是实现海量文本数据知识化、自动构建大规模知识图谱的关键技术。考虑到头尾实体信息对关系抽取有重要影响,该文采用注意力机制将实体对信息融合到关系抽取过程中,提出了基于实体对注意力机制的实体关系联合抽取模型(EPSA)。首先,使用双向长短时记忆网络(Bi-LSTM)结合条件随机场(CRF)完成实体的识别;其次,将抽取的实体配对,信息融合成统一的嵌入式表示形式,用于计算句子中各词的注意力值;然后,使用基于实体对注意力机制的句子编码模块得到句子表示,再利用显式融合实体对的信息得到增强型句子表示;最后,通过分类方式完成实体关系的抽取。在公开数据集NYT和WebNLG上对提出的EPSA模型进行评估,实现结果表明,与目前主流联合抽取模型相比,EPSA模型在F_(1)值上均得到提升,分别达到84.5%和88.5%,并解决了单一实体重叠问题。 展开更多
关键词 知识图谱 注意力机制 实体关系联合抽取
在线阅读 下载PDF
低资源场景下苹果种植领域实体关系联合抽取模型 被引量:1
12
作者 张宇 李书琴 《农业工程学报》 EI CAS CSCD 北大核心 2024年第16期188-195,共8页
由于苹果种植领域实体关系联合抽取任务标注成本高昂以及与专业领域的强相关性,提高模型在低资源场景中的抽取性能至关重要。针对这一问题,该研究提出了一种基于强化学习的实体关系联合抽取模型。模型包含实体识别模块和基于强化学习的... 由于苹果种植领域实体关系联合抽取任务标注成本高昂以及与专业领域的强相关性,提高模型在低资源场景中的抽取性能至关重要。针对这一问题,该研究提出了一种基于强化学习的实体关系联合抽取模型。模型包含实体识别模块和基于强化学习的关系抽取模块。引入强化学习的训练架构,通过关系生成器生成伪标签,训练一个策略网络以最大化伪标签数据与有标签数据在梯度方向上的相似性,同时鼓励模型在伪标签数据上进行优化,提高模型对未标注数据的泛化能力。为了验证该研究模型的效果,将其与主流的低资源场景下关系抽取模型在苹果种植领域语料库进行了对比,结果表明在标注数据占比达到30%时,该研究模型的F1值达到了88.71%,相对其余基线有较大提升,与MetaSRE相比提高了2.8个百分点。此外,在公开数据集TACRED上,该模型在低资源场景下也能对实体关系进行有效抽取,F1值达到了59.93%。该模型通过梯度模拟算法的奖励反馈机制得到可泛化的显式信号,相较于直接采用标记数据训练模型得到的隐式信号更具有指导意义,且不会导致逐步漂移问题,实现了低资源场景下实体关系的快速抽取,为苹果种植领域知识图谱高效快速构建提供了解决办法。 展开更多
关键词 苹果 联合抽取 实体识别 关系抽取 强化学习
在线阅读 下载PDF
DE-AA:基于词对距离嵌入和轴向注意力机制的实体关系联合抽取模型 被引量:2
13
作者 张梦赢 沈海龙 《计算机科学》 CSCD 北大核心 2024年第12期234-241,共8页
实体关系联合抽取为知识图谱的构建提供了关键的技术支持,而重叠关系问题一直都是联合抽取模型研究的重点。现有的方法大多采用多步骤的建模方法,虽然在解决重叠关系问题上取得了很好的效果,但产生了曝光偏差问题。为同时解决重叠关系... 实体关系联合抽取为知识图谱的构建提供了关键的技术支持,而重叠关系问题一直都是联合抽取模型研究的重点。现有的方法大多采用多步骤的建模方法,虽然在解决重叠关系问题上取得了很好的效果,但产生了曝光偏差问题。为同时解决重叠关系和曝光偏差问题,提出了一种基于词对距离嵌入和轴向注意力机制的实体关系联合抽取方法(DE-AA)。首先,构建代表词对关系的表特征,加入词对距离特征信息优化其表示;其次,应用基于行注意力和列注意力的轴向注意力模型去增强表特征,在融合全局特征的同时能够降低计算复杂度;最后,将表特征映射到各关系空间中,生成特定关系下的词对关系表,并使用表格填充法为表中各项分配标签,以三重分类的方式进行三元组的抽取。在公开数据集NYT和WebNLG上评估了所提出的模型,实验结果表明其与其他基线模型相比取得了更好的性能,且在处理重叠关系或多重关系问题上优势显著。 展开更多
关键词 实体关系联合抽取 轴向注意力机制 词对距离嵌入 表格填充法
在线阅读 下载PDF
融合交互注意力网络的实体和关系联合抽取模型 被引量:1
14
作者 郝小芳 张超群 +1 位作者 李晓翔 王大睿 《计算机工程与应用》 CSCD 北大核心 2024年第8期156-164,共9页
实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实... 实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实体和关系联合抽取模型RSIAN,该模型通过交互注意力网络来学习句子级别和关系级别的高阶语义关联,增强句子和关系之间的交互,辅助模型进行抽取决策。在构建的中文旅游数据集(TDDS)的Precision、Recall和F1值分别为0.872、0.760和0.812,其性能均优于其他对比模型;为了进一步验证该模型在英文联合抽取上的性能,在公开英文数据集NYT和Webnlg上进行实验,该模型的F1值相比基线模型RSAN模型分别提高了0.014和0.013,并且该模型在重叠三元组的分析实验也均取得了优于基线模型的性能且更稳定。 展开更多
关键词 交互注意力网络 句子级别 关系级别 实体关系联合抽取 注意力机制 重叠三元组
在线阅读 下载PDF
审计知识图谱的自动化构建——基于实体关系抽取的方法改进 被引量:1
15
作者 徐超 刘子硕 +1 位作者 周立云 黄佳佳 《财会月刊》 北大核心 2025年第10期34-39,共6页
本文聚焦于非结构化审计文本的智能分析,通过优化OneRel模型架构,创新性引入审计语义特征处理机制,形成审计实体关系抽取(Audit-OneRel)模型,突破了传统实体关系识别技术瓶颈。实验采用DuIE通用数据集与面向审计领域的指令评测数据集进... 本文聚焦于非结构化审计文本的智能分析,通过优化OneRel模型架构,创新性引入审计语义特征处理机制,形成审计实体关系抽取(Audit-OneRel)模型,突破了传统实体关系识别技术瓶颈。实验采用DuIE通用数据集与面向审计领域的指令评测数据集进行双重验证,发现改进模型对复杂文本的三元组提取能力显著增强。研究表明,改进模型通过结构化特征增强与审计领域的语义适配性,能有效提升审计知识图谱的构建质量,为风险预警与决策分析提供可靠数据支撑。基于上市公司财务数据的案例实证表明,该模型在审计线索发现与异常关联识别方面具有实践优势,为推进审计智能化转型提供了创新路径。 展开更多
关键词 审计知识图谱 实体关系抽取 OneRel 改进模型
在线阅读 下载PDF
融合强化学习的实体关系联合抽取模型 被引量:1
16
作者 翟社平 李航 +1 位作者 亢鑫年 杨锐 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期243-251,共9页
现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由... 现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由图卷积网络和多头自注意力机制构成。首先,使用强化学习去除原始数据集中带有噪声的句子,将降噪后的高质量句子输入到联合抽取模型中;其次,使用联合抽取模型对输入句子中的实体和关系进行预测抽取,并向强化学习提供反馈奖励,指导强化学习挑选出高质量的句子;最后,对强化学习和联合抽取模型进行联合训练,并对模型进行迭代优化。实验证明了该模型能够有效处理数据噪声问题,在实体关系抽取方面优于基线方法。 展开更多
关键词 实体关系联合抽取 噪声数据 强化学习 多头自注意力机制 图卷积网络
在线阅读 下载PDF
基于关系提示的单模块单步骤实体关系抽取方法研究
17
作者 刘辉 张智 王启源 《西安交通大学学报》 北大核心 2025年第3期222-234,共13页
针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层... 针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层次的关系语义信息和符号级和特征级的关系提示信息,对实体和关系提示符进行联合编码,得到统一的全局表示;同时通过注意力机制挖掘不同嵌入之间的深层关联,构建三重交互矩阵,可在一个步骤中直接从单个模块中提取所有三元组。结果表明:所提方法在NYT、WebNLG两个基准数据集上实现了最佳的表现,F_(1)分别达到了93.3%和94.9%。 展开更多
关键词 实体关系抽取 注意力机制 联合编码
在线阅读 下载PDF
基于空洞卷积神经网络的铝硅合金实体关系联合抽取模型(英文)
18
作者 李武亮 邱洪顺 +3 位作者 周治邦 罗光辉 郜洪波 王鸿湫 《材料导报》 EI CAS CSCD 北大核心 2024年第S01期501-511,共11页
近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural l... 近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural language processing,NLP)技术从铝硅合金材料文献中获取数据。命名实体识别(Named entity recognition,NER)和关系抽取(Relation extraction,RE)是NLP的两个子任务,可以高效地从文本中提取单词信息及其之间的关系。铝硅合金文献中存在多种命名实体及多种关系,本文从材料科学文献中选择11种实体类型和13种关系类型,手动标注构建了铝硅合金实体关系数据集,将命名实体识别与关系抽取进行联合学习,即对实体识别和关系抽取进行统一建模。此外,针对基础模型的编码层存在捕捉文本语义信息不充分问题,通过改进模型的编码层,将基础模型的BiLSTM层与空洞卷积模型结合,组成了新的编码器,避免了BiLSTM处理文本信息丢失的问题,最终使铝硅合金实体关系联合抽取模型能够更好地捕捉文本中句子的语义单元信息。 展开更多
关键词 材料基因组 铝硅合金文献 实体关系联合抽取 数据集 空洞卷积神经网络
在线阅读 下载PDF
基于深度学习的医学实体和关系联合抽取研究综述 被引量:1
19
作者 叶青 张晓凤 +1 位作者 彭琳 程春雷 《计算机工程与应用》 CSCD 北大核心 2024年第24期65-78,共14页
命名实体识别与关系抽取作为医学领域信息抽取的核心任务,能够从非结构化或半结构化的文本中自动识别实体边界、实体类型以及实体之间的关系。不仅能够促进知识的发现与整合,应用于临床决策,加强药物的发现和再利用,还可以助力公共卫生... 命名实体识别与关系抽取作为医学领域信息抽取的核心任务,能够从非结构化或半结构化的文本中自动识别实体边界、实体类型以及实体之间的关系。不仅能够促进知识的发现与整合,应用于临床决策,加强药物的发现和再利用,还可以助力公共卫生监测和疾病预防。回顾了实体识别和关系抽取的发展历程,介绍了常用评价指标和医学领域实体关系联合抽取数据集,指出目前联合抽取领域存在医学文本结构比较复杂、实体关系重叠句子抽取率低等问题。根据这些问题,进一步探讨了基于深度学习的实体关系联合抽取方法在医学领域上的应用。这些方法根据模型解码的方式主要分为基于共享参数的联合抽取模型和基于联合解码的联合抽取模型,从问题解决角度对不同的模型的优缺点进行探讨分析和总结。讨论了医学领域实体关系抽取面临的挑战和未来的研究方向。 展开更多
关键词 医学文本 联合抽取 关系抽取 实体识别
在线阅读 下载PDF
基于平行交互注意力网络的中文电子病历实体及关系联合抽取 被引量:3
20
作者 李丽双 王泽昊 +1 位作者 秦雪洋 袁光辉 《中文信息学报》 CSCD 北大核心 2024年第6期108-118,共11页
基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性... 基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性,在多个标准的医学和通用数据集上取得最优结果;当前中文医学实体及关系标注数据集较少,该文基于中文电子病历构建了实体和关系抽取数据集(CEMRIE),与医学专家共同制定了语料标注规范,并基于该文所提出的模型实验得出基准结果。 展开更多
关键词 实体关系联合抽取 双向特征交互模块 自注意力机制 中文电子病历 数据集标注与构建
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部