期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
基于对比学习与梯度惩罚的实体关系联合抽取模型 被引量:2
1
作者 张强 曾俊玮 陈锐 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1155-1162,共8页
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池... 针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取. 展开更多
关键词 实体关系抽取 对比学习 梯度惩罚 RoBERTa预训练模型 全局指针网络
在线阅读 下载PDF
融合限定关系和交互信息的实体关系联合抽取模型
2
作者 唐瑞雪 秦永彬 陈艳平 《中文信息学报》 CSCD 北大核心 2024年第10期106-116,共11页
实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取... 实体关系抽取作为信息抽取领域的核心任务,旨在从非结构化文本中自动抽取所有的关系三元组。现有研究较难处理句子中关系重叠的情况,存在识别冗余和语义依赖不足的问题。鉴于此,该文提出一种融合限定关系和交互信息的实体关系联合抽取模型。该模型首先对句子进行关系预测,构成限定关系集。其次,利用限定关系分别地预测可能存在关系的头实体和尾实体,解决关系重叠问题,同时缓解冗余识别。为了加强句子中实体与关系的交互,利用注意力机制强化句子中关系有关信息,通过双仿射和卷积操作来构建评分矩阵。最后,通过评分矩阵对候选三元组进行校正,确定最终的关系三元组。实验结果表明,该模型在NYT和WebNLG数据集上F1值分别达到92.0%和88.7%,相比于所对比的基线模型F1值分别提高了2.8%和1.0%,验证了模型的有效性。 展开更多
关键词 实体关系抽取 联合抽取 重叠关系 限定关系 交互信息
在线阅读 下载PDF
基于潜在关系的实体关系联合抽取模型
3
作者 彭晏飞 张睿思 +1 位作者 王瑞华 郭家隆 《计算机科学与探索》 CSCD 北大核心 2024年第4期1047-1056,共10页
实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计... 实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计一种新的解码方式来减少预测过程中关系、实体和三元组的冗余信息,从整体上分为提取潜在实体对、解码关系两步来完成从句子中抽取三元组的任务。首先通过潜在实体对提取器预测实体间是否存在潜在关系,同时筛选出置信度高的实体对作为最终的潜在实体对;其次将关系解码视作多标签二分类任务,通过关系解码器预测每个潜在实体对之间全部关系的置信度;最后通过置信度确定关系数量和类型,以完成三元组的抽取任务。在两个通用数据集上的实验结果表明,所提模型相比基线模型在准确率和F1指标上的效果更好,验证了所提模型的有效性,消融实验也证明了模型内部各部分的有效性。 展开更多
关键词 实体关系联合抽取 潜在关系 潜在实体 多标签二分类任务 信息冗余
在线阅读 下载PDF
基于实体对注意力机制的实体关系联合抽取模型 被引量:2
4
作者 朱继召 赵一霖 +2 位作者 张家鑫 黄友澎 范纯龙 《中文信息学报》 CSCD 北大核心 2024年第2期99-108,共10页
实体关系抽取是实现海量文本数据知识化、自动构建大规模知识图谱的关键技术。考虑到头尾实体信息对关系抽取有重要影响,该文采用注意力机制将实体对信息融合到关系抽取过程中,提出了基于实体对注意力机制的实体关系联合抽取模型(EPSA)... 实体关系抽取是实现海量文本数据知识化、自动构建大规模知识图谱的关键技术。考虑到头尾实体信息对关系抽取有重要影响,该文采用注意力机制将实体对信息融合到关系抽取过程中,提出了基于实体对注意力机制的实体关系联合抽取模型(EPSA)。首先,使用双向长短时记忆网络(Bi-LSTM)结合条件随机场(CRF)完成实体的识别;其次,将抽取的实体配对,信息融合成统一的嵌入式表示形式,用于计算句子中各词的注意力值;然后,使用基于实体对注意力机制的句子编码模块得到句子表示,再利用显式融合实体对的信息得到增强型句子表示;最后,通过分类方式完成实体关系的抽取。在公开数据集NYT和WebNLG上对提出的EPSA模型进行评估,实现结果表明,与目前主流联合抽取模型相比,EPSA模型在F_(1)值上均得到提升,分别达到84.5%和88.5%,并解决了单一实体重叠问题。 展开更多
关键词 知识图谱 注意力机制 实体关系联合抽取
在线阅读 下载PDF
低资源场景下苹果种植领域实体关系联合抽取模型 被引量:1
5
作者 张宇 李书琴 《农业工程学报》 EI CAS CSCD 北大核心 2024年第16期188-195,共8页
由于苹果种植领域实体关系联合抽取任务标注成本高昂以及与专业领域的强相关性,提高模型在低资源场景中的抽取性能至关重要。针对这一问题,该研究提出了一种基于强化学习的实体关系联合抽取模型。模型包含实体识别模块和基于强化学习的... 由于苹果种植领域实体关系联合抽取任务标注成本高昂以及与专业领域的强相关性,提高模型在低资源场景中的抽取性能至关重要。针对这一问题,该研究提出了一种基于强化学习的实体关系联合抽取模型。模型包含实体识别模块和基于强化学习的关系抽取模块。引入强化学习的训练架构,通过关系生成器生成伪标签,训练一个策略网络以最大化伪标签数据与有标签数据在梯度方向上的相似性,同时鼓励模型在伪标签数据上进行优化,提高模型对未标注数据的泛化能力。为了验证该研究模型的效果,将其与主流的低资源场景下关系抽取模型在苹果种植领域语料库进行了对比,结果表明在标注数据占比达到30%时,该研究模型的F1值达到了88.71%,相对其余基线有较大提升,与MetaSRE相比提高了2.8个百分点。此外,在公开数据集TACRED上,该模型在低资源场景下也能对实体关系进行有效抽取,F1值达到了59.93%。该模型通过梯度模拟算法的奖励反馈机制得到可泛化的显式信号,相较于直接采用标记数据训练模型得到的隐式信号更具有指导意义,且不会导致逐步漂移问题,实现了低资源场景下实体关系的快速抽取,为苹果种植领域知识图谱高效快速构建提供了解决办法。 展开更多
关键词 苹果 联合抽取 实体识别 关系抽取 强化学习
在线阅读 下载PDF
DE-AA:基于词对距离嵌入和轴向注意力机制的实体关系联合抽取模型 被引量:2
6
作者 张梦赢 沈海龙 《计算机科学》 CSCD 北大核心 2024年第12期234-241,共8页
实体关系联合抽取为知识图谱的构建提供了关键的技术支持,而重叠关系问题一直都是联合抽取模型研究的重点。现有的方法大多采用多步骤的建模方法,虽然在解决重叠关系问题上取得了很好的效果,但产生了曝光偏差问题。为同时解决重叠关系... 实体关系联合抽取为知识图谱的构建提供了关键的技术支持,而重叠关系问题一直都是联合抽取模型研究的重点。现有的方法大多采用多步骤的建模方法,虽然在解决重叠关系问题上取得了很好的效果,但产生了曝光偏差问题。为同时解决重叠关系和曝光偏差问题,提出了一种基于词对距离嵌入和轴向注意力机制的实体关系联合抽取方法(DE-AA)。首先,构建代表词对关系的表特征,加入词对距离特征信息优化其表示;其次,应用基于行注意力和列注意力的轴向注意力模型去增强表特征,在融合全局特征的同时能够降低计算复杂度;最后,将表特征映射到各关系空间中,生成特定关系下的词对关系表,并使用表格填充法为表中各项分配标签,以三重分类的方式进行三元组的抽取。在公开数据集NYT和WebNLG上评估了所提出的模型,实验结果表明其与其他基线模型相比取得了更好的性能,且在处理重叠关系或多重关系问题上优势显著。 展开更多
关键词 实体关系联合抽取 轴向注意力机制 词对距离嵌入 表格填充法
在线阅读 下载PDF
融合强化学习的实体关系联合抽取模型 被引量:1
7
作者 翟社平 李航 +1 位作者 亢鑫年 杨锐 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期243-251,共9页
现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由... 现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由图卷积网络和多头自注意力机制构成。首先,使用强化学习去除原始数据集中带有噪声的句子,将降噪后的高质量句子输入到联合抽取模型中;其次,使用联合抽取模型对输入句子中的实体和关系进行预测抽取,并向强化学习提供反馈奖励,指导强化学习挑选出高质量的句子;最后,对强化学习和联合抽取模型进行联合训练,并对模型进行迭代优化。实验证明了该模型能够有效处理数据噪声问题,在实体关系抽取方面优于基线方法。 展开更多
关键词 实体关系联合抽取 噪声数据 强化学习 多头自注意力机制 图卷积网络
在线阅读 下载PDF
基于空洞卷积神经网络的铝硅合金实体关系联合抽取模型(英文)
8
作者 李武亮 邱洪顺 +3 位作者 周治邦 罗光辉 郜洪波 王鸿湫 《材料导报》 EI CAS CSCD 北大核心 2024年第S01期501-511,共11页
近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural l... 近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural language processing,NLP)技术从铝硅合金材料文献中获取数据。命名实体识别(Named entity recognition,NER)和关系抽取(Relation extraction,RE)是NLP的两个子任务,可以高效地从文本中提取单词信息及其之间的关系。铝硅合金文献中存在多种命名实体及多种关系,本文从材料科学文献中选择11种实体类型和13种关系类型,手动标注构建了铝硅合金实体关系数据集,将命名实体识别与关系抽取进行联合学习,即对实体识别和关系抽取进行统一建模。此外,针对基础模型的编码层存在捕捉文本语义信息不充分问题,通过改进模型的编码层,将基础模型的BiLSTM层与空洞卷积模型结合,组成了新的编码器,避免了BiLSTM处理文本信息丢失的问题,最终使铝硅合金实体关系联合抽取模型能够更好地捕捉文本中句子的语义单元信息。 展开更多
关键词 材料基因组 铝硅合金文献 实体关系联合抽取 数据集 空洞卷积神经网络
在线阅读 下载PDF
基于跨度和特征融合的实体关系联合抽取模型 被引量:5
9
作者 廖涛 孙皓洁 张顺香 《计算机工程》 CAS CSCD 北大核心 2023年第6期107-114,共8页
实体关系联合抽取模型在实体关系抽取中具有重要作用,针对现有的实体关系联合抽取模型无法有效识别重叠关系中的实体关系三元组问题,提出一种新型的基于跨度和特征融合的实体关系联合抽取模型SFFM。将文本输入BERT预训练模型转变为词向... 实体关系联合抽取模型在实体关系抽取中具有重要作用,针对现有的实体关系联合抽取模型无法有效识别重叠关系中的实体关系三元组问题,提出一种新型的基于跨度和特征融合的实体关系联合抽取模型SFFM。将文本输入BERT预训练模型转变为词向量,根据跨度进行词向量划分形成跨度序列,并基于卷积神经网络过滤跨度序列中不包含实体的跨度序列,使用双向长短时记忆提取剩余跨度序列融合文本信息后的特征并通过Softmax回归实现实体识别,将文本中的实体和关系映射到不同的跨度序列中,当重叠关系中的实体和距离较远的实体之间存在关系时,按照跨度进行划分使可能存在关系的实体对划分到同一个跨度序列中,以更好地利用文本中的重叠关系。在此基础上,通过注意力机制获取跨度序列中的依赖关系,运用Softmax回归对跨度序列中的关系进行分类。实验结果表明,与基线模型相比,该模型在CoNLL04数据集上的微平均和宏平均分别提升了1.87和1.73个百分点,在SciERC数据集上的微平均提升了5.95个百分点。 展开更多
关键词 联合抽取 实体关系抽取 神经网络 跨度 特征融合
在线阅读 下载PDF
家禽诊疗文本多实体关系联合抽取模型研究 被引量:6
10
作者 胡滨 汤保虎 +2 位作者 姜海燕 霍傲 韩文笑 《农业机械学报》 EI CAS CSCD 北大核心 2021年第6期268-276,共9页
针对传统实体关系抽取方法中主体特征与句向量难以有效融合、现有BIO标注策略难以有效处理重叠关系的问题,提出一种基于BERT和双重指针标注的家禽疾病诊疗文本实体关系联合抽取模型(Joint extraction of entity relationship of poultry... 针对传统实体关系抽取方法中主体特征与句向量难以有效融合、现有BIO标注策略难以有效处理重叠关系的问题,提出一种基于BERT和双重指针标注的家禽疾病诊疗文本实体关系联合抽取模型(Joint extraction of entity relationship of poultry disease diagnosis and treatment text,JEER_PD)。JEER_PD使用双重指针标注(Dual-pointer labeling,DPL)策略,建立头、尾2个指针标注器,一次性标注出所有实体的开始和结束位置;引入CLN(Conditional layer normalization)网络层,强化主体抽取任务与客体关系联合抽取任务之间的联系;利用概率平衡策略PBS对抗正负类标签类别失衡,以加速模型收敛。实验表明,JEER_PD准确率、召回率和F1分别为97.69%、97.59%和97.64%,3项指标较现有方法均有显著提升,说明JEER_PD能够快速、准确地抽取家禽疾病诊疗复杂知识文本中的实体关系三元组。 展开更多
关键词 家禽疾病诊疗文本 实体关系抽取 关系重叠 BERT语言模型 双重指针标注
在线阅读 下载PDF
基于双集合预测网络的实体关系联合抽取模型 被引量:5
11
作者 彭晏飞 王瑞华 张睿思 《计算机科学与探索》 CSCD 北大核心 2023年第7期1690-1699,共10页
实体关系抽取任务旨在从非结构化文本中识别出实体和实体间的关系,是目前大规模知识图谱构建和更新的技术来源。在现有的实体关系联合抽取方法中,并行解码三元组的方法通过集合预测的方式高效生成三元组,然而这种方法忽略了实体与关系... 实体关系抽取任务旨在从非结构化文本中识别出实体和实体间的关系,是目前大规模知识图谱构建和更新的技术来源。在现有的实体关系联合抽取方法中,并行解码三元组的方法通过集合预测的方式高效生成三元组,然而这种方法忽略了实体与关系间、实体主客体间的交互,导致生成无效三元组。针对此问题,提出基于双集合预测网络的实体关系联合抽取模型。为了增强关系和实体之间的交互,采用双集合预测网络并行解码三元组,顺序生成三元组中实体信息和关系类型:第一个集合预测网络对三元组集合建模并解码出三元组内的主客体信息,第二个集合预测网络对融合了主客体信息的三元组嵌入集合建模并解码出主客体间的关系类型;针对实体主客体设计了一个实体过滤器,预测句子中实体间的主客体相关性并依照该结果过滤掉主客体相关性较低的三元组。在公开数据集纽约时报(NYT)和WebNLG上的实验结果表明,在编码器为BERT的情况下所提模型相较基线模型在准确率和F1指标上的效果更好,验证了该模型的有效性。 展开更多
关键词 实体关系联合抽取 双集合预测网络 实体过滤器 并行解码
在线阅读 下载PDF
单步片段标注的实体关系联合抽取模型 被引量:3
12
作者 郑肇谦 韩东辰 赵辉 《计算机工程与应用》 CSCD 北大核心 2023年第9期130-139,共10页
关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注。关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了模型性能。因此,提出了一种基于片段标注的实体关系... 关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注。关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了模型性能。因此,提出了一种基于片段标注的实体关系联合抽取模型(span-labeling based model,SLM),主要包括:将实体关系抽取问题转化为片段标注问题;使用滑动窗口和三种映射策略将词元(token)序列进行组合排列重新平铺成片段(span)序列;使用LSTM和多头自注意力机制进行片段深层语义特征提取;设计了实体关系标签,使用多层标注方法进行关系标签分类。在英文数据集NYT、WebNLG上进行实验,相对于基线模型F1值显著提高,验证了模型的有效性,能有效解决上述问题。 展开更多
关键词 关系抽取 联合抽取 片段标注 映射策略 暴露偏差 实体嵌套 实体重叠
在线阅读 下载PDF
基于森林的实体关系联合抽取模型
13
作者 王炫力 靳小龙 +2 位作者 侯中妮 廖华明 张瑾 《计算机应用》 CSCD 北大核心 2023年第9期2700-2706,共7页
嵌套实体对实体关系联合提取任务提出了挑战。现有的联合抽取模型在处理嵌套实体时存在产生大量负例且复杂度高的问题,此外未考虑嵌套实体对三元组预测的干扰。针对以上问题,提出一种基于森林的实体关系联合抽取方法——EF2LTF(Entity F... 嵌套实体对实体关系联合提取任务提出了挑战。现有的联合抽取模型在处理嵌套实体时存在产生大量负例且复杂度高的问题,此外未考虑嵌套实体对三元组预测的干扰。针对以上问题,提出一种基于森林的实体关系联合抽取方法——EF2LTF(Entity Forest to Layering Triple Forest)。EF2LTF采用了一个两阶段的联合训练框架,首先通过生成实体森林灵活地在嵌套实体内部识别不同的实体;然后结合已识别出的嵌套实体及其层次结构生成分层的三元组森林。在四个标准数据集上的实验结果表明,与基于集合预测网络的SPN(Set Prediction Network)模型、基于跨度的实体关系联合抽取模型SpERT(Span-based Entity and Relation Transformer)和动态图增强信息抽取(DyGIE++)等方法相比,所提方法取得了最优的F1值。说明所提方法既增强了嵌套实体的识别能力,也增强了构建三元组时对嵌套实体的分辨能力,从而提升了实体与关系的联合抽取性能。 展开更多
关键词 实体关系联合抽取 三元组生成 嵌套实体 分层预测 实体森林
在线阅读 下载PDF
基于强化学习的实体关系联合抽取模型 被引量:7
14
作者 陈佳沣 滕冲 《计算机应用》 CSCD 北大核心 2019年第7期1918-1924,共7页
针对现有的基于远程监督的实体和关系抽取方法存在着标签噪声问题,提出了一种基于强化学习的实体关系联合抽取方法。该模型有两个模块:句子选择器模块和实体关系联合抽取模块。首先,句子选择器模块选择没有标签噪声的高质量句子,将所选... 针对现有的基于远程监督的实体和关系抽取方法存在着标签噪声问题,提出了一种基于强化学习的实体关系联合抽取方法。该模型有两个模块:句子选择器模块和实体关系联合抽取模块。首先,句子选择器模块选择没有标签噪声的高质量句子,将所选句子输入到实体关系联合抽取模型;然后,实体关系联合抽取模块采用序列标注方法对输入的句子进行预测,并向句子选择器模块提供反馈,指导句子选择器模块挑选高质量的句子;最后,句子选择器模块和实体关系联合抽取模块同时训练,将句子选择与序列标注一起优化。实验结果表明,该模型在实体关系联合抽取中的F1值为47.3%,与CoType为代表的联合抽取模型相比,所提模型的F1值提升了1%;与LINE为代表的串行模型相比,所提模型的F1值提升了14%。结果表明强化学习结合实体关系联合抽取模型能够有效地提高序列标注模型的F1值,其中句子选择器能有效地处理数据的噪声。 展开更多
关键词 强化学习 联合抽取 序列标注 命名实体识别 关系分类
在线阅读 下载PDF
基于片段排列和多头选择的实体识别与关系抽取联合模型
15
作者 陈雷 郑小盈 +1 位作者 祝永新 封松林 《计算机应用与软件》 北大核心 2025年第5期238-246,共9页
针对传统的信息抽取方法存在实体重叠、误差积累和依赖关系缺失等问题,该文提出一种基于片段排列和多头选择的实体识别与关系抽取联合模型。通过共享编码层来建立实体识别与关系抽取之间的依赖;通过片段排列的方式在span的层面解决实体... 针对传统的信息抽取方法存在实体重叠、误差积累和依赖关系缺失等问题,该文提出一种基于片段排列和多头选择的实体识别与关系抽取联合模型。通过共享编码层来建立实体识别与关系抽取之间的依赖;通过片段排列的方式在span的层面解决实体重叠问题;使用多头选择机制来预测实体之间的关系,并加入对抗训练,通过辅助损失函数进行约束。通过消融实验和基于不同权重损失函数的实验,找到了效果最好的参数。该模型在中文数据集DuIE 2.0上取得了F1值0.829的效果,相对于效果最好的基线模型提升2.24%。 展开更多
关键词 实体关系抽取 联合抽取 多头选择 片段排列模型
在线阅读 下载PDF
基于实体关系联合抽取的装备RCMA知识图谱构建
16
作者 李云凯 任占勇 +1 位作者 贾治宇 苗强 《兵器装备工程学报》 北大核心 2025年第5期57-66,共10页
现有装备保障性分析工作还存在着一些挑战,例如对客观数据和历史数据利用不足、数据知识有效表征化程度不高以及无法进行知识推送等问题。而知识图谱是利用数据表示现实世界实体与关系的信息网络,是解决上述问题的有效方案。为了实现数... 现有装备保障性分析工作还存在着一些挑战,例如对客观数据和历史数据利用不足、数据知识有效表征化程度不高以及无法进行知识推送等问题。而知识图谱是利用数据表示现实世界实体与关系的信息网络,是解决上述问题的有效方案。为了实现数据驱动的装备以可靠性为中心的维修分析(RCMA),提出一种可以支撑保障性分析的装备RCMA知识图谱构建方法。首先,梳理装备RCMA流程,分析可以用于知识图谱的装备RCMA实体与关系,实现知识图谱的模式层构建。其次,通过单步骤-单模型的实体关系联合抽取方法,使用细粒度三分类模型OneRel从装备RCMA相关文本数据中抽取出三元组,实现知识图谱的数据层构建。最后,选用Neo4j图数据库进行存储,完成了装备RCMA知识图谱的构建。针对装备RCMA相关文本数据进行知识抽取实验,实验结果表明,使用实体关系联合模型的知识抽取在精确率上达到91%,比传统流水线方法用到的知识抽取模型精确率更高,且在构建流程上实现了优化。 展开更多
关键词 RCMA 保障性分析 知识图谱 实体关系联合抽取 深度学习
在线阅读 下载PDF
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:2
17
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于并联残差膨胀卷积网络的短文本实体关系联合抽取
18
作者 曾伟 奚雪峰 崔志明 《现代电子技术》 北大核心 2025年第2期169-178,共10页
关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题... 关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题。为此,文中提出一种基于并联残差膨胀卷积网络的短文本实体关系联合抽取方法。该方法利用BERT生成语义特征信息,采用并联残差膨胀卷积网络来捕获语义信息,从而提升上下文信息的捕获能力并缓解噪声。联合抽取框架通过抽取潜在关系来过滤无关关系,然后再抽取实体以预测三元组,从而解决关系冗余和重叠问题,并提高计算效率。实验结果表明,与现有的主流模型相比,所提模型在三个公共数据集NYT、WebNLG和DuIE上的F1值分别为90.9%、91.3%和73.5%,相较于基线模型均有提升,验证了该模型的有效性。 展开更多
关键词 实体关系抽取 短文本 残差膨胀卷积网络 语义特征 联合抽取 BERT编码器
在线阅读 下载PDF
基于大语言模型的实体关系抽取综述 被引量:1
19
作者 夏江镧 李艳玲 葛凤培 《计算机科学与探索》 北大核心 2025年第7期1681-1698,共18页
实体关系抽取任务旨在从非结构化文本中识别实体对及其相互关系,是众多自然语言处理下游任务应用的基础。随着大数据和深度学习技术的发展,实体关系抽取的研究取得了显著进展。近年来,将大语言模型应用于实体关系抽取任务已成为新的研... 实体关系抽取任务旨在从非结构化文本中识别实体对及其相互关系,是众多自然语言处理下游任务应用的基础。随着大数据和深度学习技术的发展,实体关系抽取的研究取得了显著进展。近年来,将大语言模型应用于实体关系抽取任务已成为新的研究趋势。大语言模型具备自动特征提取和强大的泛化能力,能够显著提升任务性能。对实体关系抽取的方法进行综述,并根据所使用的方法和模型的演变将其划分为两大类。介绍了命名实体识别和关系抽取任务的定义。系统回顾了实体关系抽取方法的发展历程,并对其相应模型的优缺点进行了深入分析。在此基础上,重点探讨了基于大语言模型的方法在解决实体关系抽取任务中的独特优势。整理了当前主流数据集的特点,并总结了实体关系抽取任务的常用评价指标,如精确率、召回率和F1值等。分析了当前研究中存在的挑战并对未来研究方向进行了展望。 展开更多
关键词 大语言模型 实体关系抽取 命名实体识别
在线阅读 下载PDF
基于大语言模型的中文开放领域实体关系抽取策略
20
作者 龚永罡 陈舒汉 +3 位作者 廉小亲 李乾生 莫鸿铭 刘宏宇 《计算机应用》 北大核心 2025年第10期3121-3130,共10页
大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略... 大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略利用LLM优秀的语义理解和迁移学习能力,通过多轮不同任务的对话实现实体关系抽取。首先,基于开放领域文本结构化逻辑和思维链(CoT)机制,使用LLM生成结构化摘要,避免模型产生关系、事实幻觉和无法兼顾后文信息的问题;其次,通过文本简化策略并引入可替换词表,减少上下文窗口的限制;最后,基于结构化摘要和简化文本构建多级提示模板,使用LLaMA-2-70B模型探究参数temperature对实体关系抽取的影响。测试了LLaMA-2-70B在使用所提策略前后进行实体关系抽取的精准率、召回率、调和平均值(F1)和精确匹配(EM)值。实验结果表明,在CL-NE-DS、DiaKG和CCKS2021等5个不同领域的中文数据集上,所提策略提升了LLM在命名实体识别(NER)和关系抽取(RE)上的性能。特别是在专业性强且模型零样本测试结果不佳的DiaKG和IEPA数据集上,在应用所提策略后,相较于少样本提示测试,在NER上模型的精准率分别提升了9.3和6.7个百分点,EM值提升了2.7和2.2个百分点;在RE上模型的精准率分别提升了12.2和16.0个百分点,F1值分别提升了10.7和10.0个百分点。实验结果验证了所提策略能有效提升LLM实体关系抽取的效果并解决模型性能不稳定的问题。 展开更多
关键词 大语言模型 中文开放领域 命名实体识别 关系抽取 提示学习
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部