期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
融合自注意力和实体类型知识的实体关系联合抽取模型 被引量:1
1
作者 张思邈 朱继召 +1 位作者 刘颢 范纯龙 《中国电子科学研究院学报》 2024年第1期84-90,共7页
从非结构化文本中抽取实体关系三元组是自然语言处理中的主要任务形式之一。目前主流的方法是采用联合式抽取,能够在训练过程中自动捕捉到实体与关系间的依赖知识,提高了实体和关系的抽取效果。但这些方法忽略了实体的类型知识,导致大... 从非结构化文本中抽取实体关系三元组是自然语言处理中的主要任务形式之一。目前主流的方法是采用联合式抽取,能够在训练过程中自动捕捉到实体与关系间的依赖知识,提高了实体和关系的抽取效果。但这些方法忽略了实体的类型知识,导致大量的冗余计算和错误结果的产生。鉴于此,文中提出一种融合注意力和实体类型知识的实体关系联合抽取方法。首先,采用预训练模型BERT作为编码器得到句子中各字符的向量表示,再经双向LSTM层处理得到最终的语义表示;其次,基于表示层的结果完成头、尾实体的识别;接着,通过融合不同头实体的语义信息到句子表示中,实现头实体类型约束下的潜在语义关系发现;最后,将头实体和关系分别输入自注意力模块识别出对应尾实体,得到实体关系三元组。通过在公开数据集NYT和WebNLG上的大量实验表明:文中所提模型在实体关系联合抽取任务中的F1值达到了93.2%和93.3%,与当前主流模型相比提升显著。 展开更多
关键词 自注意力机制 BERT 实体关系三元组 联合抽取
在线阅读 下载PDF
融合强化学习的实体关系联合抽取模型 被引量:1
2
作者 翟社平 李航 +1 位作者 亢鑫年 杨锐 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期243-251,共9页
现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由... 现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由图卷积网络和多头自注意力机制构成。首先,使用强化学习去除原始数据集中带有噪声的句子,将降噪后的高质量句子输入到联合抽取模型中;其次,使用联合抽取模型对输入句子中的实体和关系进行预测抽取,并向强化学习提供反馈奖励,指导强化学习挑选出高质量的句子;最后,对强化学习和联合抽取模型进行联合训练,并对模型进行迭代优化。实验证明了该模型能够有效处理数据噪声问题,在实体关系抽取方面优于基线方法。 展开更多
关键词 实体关系联合抽取 噪声数据 强化学习 多头自注意力机制 图卷积网络
在线阅读 下载PDF
基于空洞卷积神经网络的铝硅合金实体关系联合抽取模型(英文)
3
作者 李武亮 邱洪顺 +3 位作者 周治邦 罗光辉 郜洪波 王鸿湫 《材料导报》 EI CAS CSCD 北大核心 2024年第S01期501-511,共11页
近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural l... 近年来,材料基因组计划(Material genome initiative,MGI)已经成为全球热点。随着材料科学的不断发展,材料文献中包含的海量信息成为研究人员关注的焦点,如何获取大量有效的材料数据是现阶段的主要挑战。本文采用自然语言处理(Natural language processing,NLP)技术从铝硅合金材料文献中获取数据。命名实体识别(Named entity recognition,NER)和关系抽取(Relation extraction,RE)是NLP的两个子任务,可以高效地从文本中提取单词信息及其之间的关系。铝硅合金文献中存在多种命名实体及多种关系,本文从材料科学文献中选择11种实体类型和13种关系类型,手动标注构建了铝硅合金实体关系数据集,将命名实体识别与关系抽取进行联合学习,即对实体识别和关系抽取进行统一建模。此外,针对基础模型的编码层存在捕捉文本语义信息不充分问题,通过改进模型的编码层,将基础模型的BiLSTM层与空洞卷积模型结合,组成了新的编码器,避免了BiLSTM处理文本信息丢失的问题,最终使铝硅合金实体关系联合抽取模型能够更好地捕捉文本中句子的语义单元信息。 展开更多
关键词 材料基因组 铝硅合金文献 实体关系联合抽取 数据集 空洞卷积神经网络
在线阅读 下载PDF
一种基于先验知识的实体关系联合抽取模型 被引量:1
4
作者 周博学 《信息技术》 2022年第4期130-136,142,共8页
不同于流水线方式的关系抽取方法,在实体关系联合抽取方式中虽然把实体识别和关系抽取两者结合起来,但损失部分实体特征信息。在以BERT预训练模型为核心的SpERT实体关系联合抽取模型输入阶段,融入置信度较高的词性标注和句法依存关系的... 不同于流水线方式的关系抽取方法,在实体关系联合抽取方式中虽然把实体识别和关系抽取两者结合起来,但损失部分实体特征信息。在以BERT预训练模型为核心的SpERT实体关系联合抽取模型输入阶段,融入置信度较高的词性标注和句法依存关系的先验特征;并在模型的关系抽取层中重用输入信息,为关系抽取任务提供更多的特征;在优化模型的损失函数中加入可训练的参数来自主学习两个子任务的损失占比权重。在三个公共的数据集上进行实验,结果表明这些优化策略能够为SpERT模型带来明显性能提升。 展开更多
关键词 实体关系联合抽取 词性标注 句法依存关系 损失占比优化 BERT模型
在线阅读 下载PDF
基于大语言模型的烟草行业实体与关系抽取研究
5
作者 张乾 谢雯燕 +2 位作者 侯磊 余叶琦 曾令杰 《科技创新与应用》 2025年第16期44-47,共4页
该研究针对烟草行业的实体与关系抽取问题,提出一种基于大语言模型的技术方案。通过引入提示词工程,优化模型的抽取效果,提高抽取的准确度和效率。实验结果表明,基于语义相似度的检索召回策略优于随机召回策略,思维链策略在提升少样本... 该研究针对烟草行业的实体与关系抽取问题,提出一种基于大语言模型的技术方案。通过引入提示词工程,优化模型的抽取效果,提高抽取的准确度和效率。实验结果表明,基于语义相似度的检索召回策略优于随机召回策略,思维链策略在提升少样本情况下的模型性能方面表现突出。改进后的模型在烟草行业实体与关系抽取任务中准确率、召回率、F1分数等评估指标显著提升。 展开更多
关键词 大语言模型 实体关系抽取 提示词工程 烟草行业 技术方案
在线阅读 下载PDF
基于并联残差膨胀卷积网络的短文本实体关系联合抽取
6
作者 曾伟 奚雪峰 崔志明 《现代电子技术》 北大核心 2025年第2期169-178,共10页
关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题... 关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题。为此,文中提出一种基于并联残差膨胀卷积网络的短文本实体关系联合抽取方法。该方法利用BERT生成语义特征信息,采用并联残差膨胀卷积网络来捕获语义信息,从而提升上下文信息的捕获能力并缓解噪声。联合抽取框架通过抽取潜在关系来过滤无关关系,然后再抽取实体以预测三元组,从而解决关系冗余和重叠问题,并提高计算效率。实验结果表明,与现有的主流模型相比,所提模型在三个公共数据集NYT、WebNLG和DuIE上的F1值分别为90.9%、91.3%和73.5%,相较于基线模型均有提升,验证了该模型的有效性。 展开更多
关键词 实体关系抽取 短文本 残差膨胀卷积网络 语义特征 联合抽取 BERT编码器
在线阅读 下载PDF
基于预训练大语言模型的实体关系抽取框架及其应用
7
作者 魏伟 金成功 +3 位作者 杨龙 周默 孟祥主 冯慧 《应用科学学报》 北大核心 2025年第1期20-34,共15页
实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环... 实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环经济政策进行了实体关系抽取研究。基于所提出的PLLM-RE框架,首先使用RoBERTa模型进行循环经济政策文本的实体识别,然后选取基于Transformer的双向编码器表示(bidirectional encoder representation from Transformers, BERT)模型进行循环经济政策实体关系抽取研究,以构建该政策领域的知识图谱。研究结果表明,PLLM-RE框架在循环经济政策实体关系抽取任务上的性能优于对比模型BiLSTM-ATT、PCNN、BERT以及ALBERT,验证了所提框架在循环经济政策实体关系抽取任务上的适配性和优越性,为后续循环经济领域资源的信息挖掘和政策分析提供了新思路。 展开更多
关键词 预训练大语言模型 实体关系抽取框架 循环经济政策 政策分析
在线阅读 下载PDF
基于关系提示的单模块单步骤实体关系抽取方法研究
8
作者 刘辉 张智 王启源 《西安交通大学学报》 北大核心 2025年第3期222-234,共13页
针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层... 针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层次的关系语义信息和符号级和特征级的关系提示信息,对实体和关系提示符进行联合编码,得到统一的全局表示;同时通过注意力机制挖掘不同嵌入之间的深层关联,构建三重交互矩阵,可在一个步骤中直接从单个模块中提取所有三元组。结果表明:所提方法在NYT、WebNLG两个基准数据集上实现了最佳的表现,F_(1)分别达到了93.3%和94.9%。 展开更多
关键词 实体关系抽取 注意力机制 联合编码
在线阅读 下载PDF
一种标签融合驱动的中文医疗实体关系抽取方法
9
作者 陈闯 张维彦 +1 位作者 阮彤 郑红 《华东理工大学学报(自然科学版)》 北大核心 2025年第2期260-269,共10页
医疗实体关系抽取是推动医疗信息化建设的关键步骤,旨在从医疗文本中抽取结构化的三元组信息。针对现有方法对实体类型标签和关系标签利用不充分的问题,提出了一种标签融合驱动的中文医疗实体关系抽取框架。首先,将实体关系抽取任务拆... 医疗实体关系抽取是推动医疗信息化建设的关键步骤,旨在从医疗文本中抽取结构化的三元组信息。针对现有方法对实体类型标签和关系标签利用不充分的问题,提出了一种标签融合驱动的中文医疗实体关系抽取框架。首先,将实体关系抽取任务拆分成双向的4个命名实体识别任务,并将每个任务的标签替换为头尾实体类型标签和关系标签的融合;其次,设计了三元组构造策略以最大限度利用双向抽取出的三元组;最后,利用三元组双向过滤模型筛选候选三元组。结果表明,该方法相较于GPLinker在F1指标上提升了3.01%。此外,该方法在医疗领域的重叠关系、多三元组和跨句三元组复杂场景中也表现出了优秀的性能。 展开更多
关键词 医疗文本 实体关系抽取 标签融合 双向抽取 三元组过滤模型
在线阅读 下载PDF
基于异构图注意力网络的药物不良反应实体关系联合抽取研究 被引量:2
10
作者 仲雨乐 韩普 许鑫 《现代情报》 CSSCI 北大核心 2024年第9期71-81,共11页
[目的/意义]实体关系联合抽取是药物不良反应监测和知识组织的关键环节。为解决传统流水线抽取方法中误差传递、实体冗余和交互缺失问题,提升药物不良反应重叠三元组抽取效果,提出了一种基于异构图注意力网络的药物不良反应实体关系联... [目的/意义]实体关系联合抽取是药物不良反应监测和知识组织的关键环节。为解决传统流水线抽取方法中误差传递、实体冗余和交互缺失问题,提升药物不良反应重叠三元组抽取效果,提出了一种基于异构图注意力网络的药物不良反应实体关系联合抽取模型MF-HGAT。[方法/过程]首先通过BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;其次将关系信息作为先验知识引入为异构图节点,以避免提取语义无关实体;然后通过迭代融合异构图注意力网络消息传递机制增强字符与关系节点表示;最后在节点表示更新后抽取药物不良反应实体关系。[结果/结论]在自构建药物不良反应数据集上进行实验,发现融入关系信息和外部医疗健康领域知识的MF-HGAT联合抽取F1值达到了92.75%,较主流模型CasRel提升了5.29%。研究结果表明,MF-HGAT模型通过异构图注意力网络融合字符与关系节点语义,可有效解决药物不良反应实体关系重叠问题,对药物不良反应知识发现具有重要意义。 展开更多
关键词 异构图注意力网络 实体关系联合抽取 药物不良反应 关系重叠 知识发现
在线阅读 下载PDF
融合实体语义的实体关系抽取联合解码
11
作者 张鑫 张思佳 《现代电子技术》 北大核心 2024年第14期41-45,共5页
针对复杂语境中存在多义词或上下文联系不强的实体,导致模型难以正确识别其关系的问题,提出一种基于BERT和联合解码的实体关系抽取模型。该模型首先采用BERT对实体进行语义编码,提取出实体的上下文信息;然后,利用自注意力机制标记出头实... 针对复杂语境中存在多义词或上下文联系不强的实体,导致模型难以正确识别其关系的问题,提出一种基于BERT和联合解码的实体关系抽取模型。该模型首先采用BERT对实体进行语义编码,提取出实体的上下文信息;然后,利用自注意力机制标记出头实体,并对尾实体进行预测;最后,设计联合解码机制,结合实体语义信息和关系抽取任务进行联合解码。实验结果表明,与基准模型相比,所提模型在纽约时报(NYT)数据集和WebNLG数据集上的准确率和F1值均有所提高,能够有效地提高实体关系提取的准确性。 展开更多
关键词 实体关系抽取 实体语义 BERT 联合编码 自注意力机制 知识图谱
在线阅读 下载PDF
基于深度学习的实体关系联合抽取研究综述 被引量:16
12
作者 张仰森 刘帅康 +2 位作者 刘洋 任乐 辛永辉 《电子学报》 EI CAS CSCD 北大核心 2023年第4期1093-1116,共24页
实体关系抽取是信息抽取领域的核心任务.从文本中抽取的实体关系三元组是构建大规模知识图谱的基础.传统的流水线方法将实体关系抽取分解为独立的命名实体识别和关系抽取两个子任务.首先,构建一个高效的命名实体识别器,从大规模非结构... 实体关系抽取是信息抽取领域的核心任务.从文本中抽取的实体关系三元组是构建大规模知识图谱的基础.传统的流水线方法将实体关系抽取分解为独立的命名实体识别和关系抽取两个子任务.首先,构建一个高效的命名实体识别器,从大规模非结构化文本语句中识别实体边界和类型.然后,将该命名实体识别器识别的实体与类型作为关系抽取任务中所用数据的标注.最后,通过关系抽取器得到两个实体之间的关系类别,进而组合成为结构化的实体关系三元组.命名实体识别任务存在的误差会影响后续的关系抽取任务的性能,这使得流水线方法具有错误累积问题.这是因为关系抽取任务中使用的标注数据来自于前面的命名实体识别任务,这会有一定的误差,进而影响关系抽取的结果质量.此外,流水线方法减弱了两个子任务之间的特征关联,这会出现冗余实体的问题.命名实体识别任务和关系抽取任务独立进行学习训练,导致这两个子任务间缺乏交互,使得文本信息没有得到充分利用,限制了流水线方法的性能瓶颈.由于非结构化文本信息没有得到充分利用,流水线方法在抽取实体间长依赖关系时具有一定局限性,很难达到联合抽取模型的性能指标.实际应用中,实体间往往存在多种关系,流水线方法无法充分使用全局文本信息,且命名实体识别会产生冗余实体,在抽取多元重叠关系时,该方法具有一定的局限性.因此,在构建高准确率实体关系抽取模型时,流水线方法具有欠缺之处.本文对实体关系联合抽取的研究发展全景进行了综述,简要阐明整数线性规划、卡片金字塔解析模型、概率图模型和结构化预测模型这四类基于特征工程的联合模型的共同缺点.本文聚焦基于深度学习的实体关系联合抽取技术,根据近年来实体关系联合抽取前沿研究成果,总结了实体关系联合抽取模型的主流构建方法.按照建模思想的特点总结为三种建模方法:多模块-多步骤、多模块-单步骤以及单模块-单步骤.多模块-多步骤建模方法主要包含实体域映射关系域、关系域映射实体域和头实体域映射关系-尾实体域这三种类别.这三类模型的共同特点都是将三元组的提取过程分为多个模块,通过共享参数的方式整合各个模块,逐步迭代得到三元组.这种方法推动联合模型性能提升,初步解决了流水线方法存在的问题.但每个步骤使用独立的解码算法,导致解码误差累积问题.且共享参数整合各个模块的冗余误差会互相影响预测性能,从而产生级联冗余问题.多模块-单步骤建模方法旨在构建一个最优化的联合解码算法,并对其求取最优解进而得到最优超参数.这种方法设计了简单精确的联合解码算法,并加强了多个子模块间的交互性,减弱了因为逐步迭代导致的解码误差和级联冗余对联合模型性能的影响.然而,模块的分离依然会产生冗余错误,具有一定局限性.单模块-单步骤建模方法可以直接从文本语句中抽取三元组,有效缓解了多模块-多步骤和多模块-单步骤建模方法的级联错误和实体冗余等问题.本文以前沿文献中具有代表性的联合模型为例,详细分析了这些模型的建模思路,剖析了各个模型的优缺点,将多个具有共同建模思路的经典模型进行归类,以阐述实体关系联合抽取模型的发展趋势.本文将单模块-单步骤建模方法的代表模型在公开基准数据集上的模型性能与多模块-多步骤和多模块-单步骤的代表模型性能进行对比分析,阐明实体关系联合抽取模型的建模思路正在从基于多模块-多步骤和多模块-单步骤的复杂建模方法,逐渐向单模块-单步骤的高效建模方法转变的客观趋势.最后,本文对三个实体关系联合抽取的研究方向进行了展望.当下主流的联合模型聚焦于限定域的实体关系抽取任务,对于开放域问题研究得不够.开放域实体关系联合抽取任务是未来的研究人员亟待解决的问题之一.在实际工业应用中,文本语料包含多元信息,如时序信息.而当前的实体关系联合抽取模型大多依据单一文本上下文信息进行特征抽取,从而忽略了时序信息.若融入像时序信息这样的多元信息或能进一步提升联合模型性能,这是未来一项具有重大意义的课题.此外,对于跨文本的实体关系联合抽取模型研究较少,这也是该领域未来的一个研究趋势.本文旨在建立一个完整的基于深度学习的实体关系联合抽取领域研究视图,以对相关领域研究者有所帮助. 展开更多
关键词 信息抽取 知识图谱 深度学习 实体关系联合抽取 流水线方法
在线阅读 下载PDF
基于依存图卷积的实体关系抽取模型 被引量:3
13
作者 刘源 刘胜全 +1 位作者 常超义 孙伟智 《现代电子技术》 2022年第13期111-117,共7页
目前大多数端到端的关系抽取方法解决了流水线方法的误差累计问题,但是仍然存在两个问题:结构特征表示不足,缺乏句法结构等信息;句子中存在着大量实体重叠关系,未考虑这些实体重叠关系的抽取导致关系三元组召回率低的问题。针对这些问题... 目前大多数端到端的关系抽取方法解决了流水线方法的误差累计问题,但是仍然存在两个问题:结构特征表示不足,缺乏句法结构等信息;句子中存在着大量实体重叠关系,未考虑这些实体重叠关系的抽取导致关系三元组召回率低的问题。针对这些问题,提出一种基于图卷积神经网络的实体关系抽取模型。使用依存句法分析对文本构图,然后通过双向GraphSage提取其结构特征,融入句法结构的特征向量在预测关系时有着更好的表现。而对于关系重叠问题,一次性将所有关系抽取较为困难,因此将该任务分为两步:第一步只抽取非重叠关系与单实体重叠关系;第二步中语言模型抽取关系触发词,并与实体词一起构建实体关系图,这一步能够提高实体对重叠关系的抽取能力。 展开更多
关键词 关系抽取 图神经网络 关系触发词 深度学习 实体重叠 依存句法树 多任务学习 预训练语言模型
在线阅读 下载PDF
基于BERT-CNN编码特征融合的实体关系联合抽取方法 被引量:2
14
作者 丁建立 苏伟 《中国民航大学学报》 CAS 2023年第2期47-53,共7页
针对现有实体关系抽取模型结构复杂且抽取效果欠佳的问题,提出基于预训练的BERT(bidirectional encoder representation from transformers)与CNN(convolutional neural network)编码特征融合的实体关系联合抽取方法。首先,基于BERT-CN... 针对现有实体关系抽取模型结构复杂且抽取效果欠佳的问题,提出基于预训练的BERT(bidirectional encoder representation from transformers)与CNN(convolutional neural network)编码特征融合的实体关系联合抽取方法。首先,基于BERT-CNN编码的句子向量预测主语的首尾位置;其次,将预测的首尾位置索引句子中的特征向量作为预测主语的首尾向量,再将预测的主语首尾向量采用乘积方式进行特征融合得到主语向量;然后,将主语向量与句子向量以乘积方式融合得到新的句子编码向量,进而指导不同关系下宾语首尾位置的预测,得到实体关系三元组。为了验证模型效果,将本模型与其他类似算法模型在NYT与WebNLG公开数据集上进行对比实验,其准确率、召回率均优于对比模型且F1值分别达到92.75%与93.19%。 展开更多
关键词 BERT CNN 特征融合 二分类 实体关系联合抽取 实体关系三元组
在线阅读 下载PDF
矿山知识图谱构建的实体关系抽取方法研究
15
作者 杨森森 李海涛 +1 位作者 杜伟升 薛珊珊 《煤炭技术》 CAS 2024年第11期259-263,共5页
知识图谱描述实体及其关系,对煤矿管理、安全监控等提供支撑。构建煤矿知识图谱面临数据多样性和语义关系挑战。提出一种基于ALBERT-BiLSTM-Att-CRF的方法,通过特征提取、上下文捕捉、注意力机制和CRF层优化实体关系抽取,展示较高的准... 知识图谱描述实体及其关系,对煤矿管理、安全监控等提供支撑。构建煤矿知识图谱面临数据多样性和语义关系挑战。提出一种基于ALBERT-BiLSTM-Att-CRF的方法,通过特征提取、上下文捕捉、注意力机制和CRF层优化实体关系抽取,展示较高的准确率和F1值,为煤矿智能化提供技术支撑。 展开更多
关键词 矿山 知识图谱 实体关系抽取 ALBERT-BiLSTM-Att-CRF模型
在线阅读 下载PDF
基于大语言模型和知识图谱的电力传媒事件抽取与分析
16
作者 李嘉 臧艳娇 顾琛兰 《中国传媒科技》 2025年第3期141-145,共5页
【目的】在当前我国电力体制深化改革与行业蓬勃发展的背景下,电力传媒作为电力行业与公众的关键沟通桥梁,正面临着电力新闻事件数量激增与信息高效管理两大核心挑战,迫切需要寻求有效的应对策略。【方法】本文的目的是探索并提出一种... 【目的】在当前我国电力体制深化改革与行业蓬勃发展的背景下,电力传媒作为电力行业与公众的关键沟通桥梁,正面临着电力新闻事件数量激增与信息高效管理两大核心挑战,迫切需要寻求有效的应对策略。【方法】本文的目的是探索并提出一种创新性的解决方案,以应对这些挑战。基于对当前资源素材与技术进步的深入考量,本文创造性地设计了一种融合大语言模型与知识图谱技术的电力传媒事件抽取与分析方法。【结果】该方法能够精确识别电力领域的关键实体,并深入挖掘这些实体之间错综复杂的关联,进而构建出电力传媒领域的知识图谱。【结论】通过知识图谱所呈现的网状关系结构与大语言模型强大的语义理解能力,实现信息检索的高效性与交互体验的直观性双重提升。该方法显著增强了用户的信息获取与利用能力,为电力媒体行业的智能化发展提供了有力的技术支持。 展开更多
关键词 电力传媒 大语言模型 知识图谱 实体抽取 关系抽取
在线阅读 下载PDF
结合词语规则和SVM模型的军事命名实体关系抽取方法 被引量:7
17
作者 单赫源 吴照林 +1 位作者 张海粟 刘培磊 《指挥控制与仿真》 2016年第4期58-63,共6页
抽取作战文书中的军事命名实体关系,是实现作战文书语义理解的一种有效方法。在分析作战文书中军事命名实体词语规则的基础上,提出了一种结合词语规则和SVM模型的军事命名实体关系抽取方法。首先,使用词语规则整合作战文书中连续出现的... 抽取作战文书中的军事命名实体关系,是实现作战文书语义理解的一种有效方法。在分析作战文书中军事命名实体词语规则的基础上,提出了一种结合词语规则和SVM模型的军事命名实体关系抽取方法。首先,使用词语规则整合作战文书中连续出现的军事命名实体并抽取其关系,使其更加适合SVM模型。然后,使用SVM模型对传统规则模板难以使用的词窗、词性和距离等特征进行建模,抽取军事命名实体关系。实验结果表明,优先利用词语规则能充分提高SVM模型抽取军事命名实体关系的效果,与单纯使用SVM模型相比,准确率和召回率分别提高了8.73%和41.71%。 展开更多
关键词 军事命名实体 SVM模型 实体关系抽取 词语规则
在线阅读 下载PDF
铝硅合金实体关系抽取数据集的构建方法 被引量:4
18
作者 刘英莉 吴瑞刚 +1 位作者 么长慧 沈韬 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期245-253,共9页
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标... 针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注.在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集.通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务.与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差.针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%.该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集. 展开更多
关键词 数据集 构建标准 数据标注 实体关系联合抽取模型 自注意力机制
在线阅读 下载PDF
结合词语规则和SVM模型的军事命名实体关系抽取方法 被引量:1
19
作者 高凤帅 杨化斌 《信息通信》 2017年第11期162-163,共2页
作战文书一直是我国军事中的一项重要任务,但是由于作战文书的特殊性和保密性,写者都会用一些带有特殊性质的东西来掩人耳目,但是作战文书非常重要,关乎作战中军事命名和实体作战的关系,稍有不慎就会理解错误,轻则会违反规定,重则会直... 作战文书一直是我国军事中的一项重要任务,但是由于作战文书的特殊性和保密性,写者都会用一些带有特殊性质的东西来掩人耳目,但是作战文书非常重要,关乎作战中军事命名和实体作战的关系,稍有不慎就会理解错误,轻则会违反规定,重则会直接影响到我国的经济利益和国土安全,因此,抽取作战文书中的主要意思,弄清楚军事命名实体关系,对实现作战文书语义理解有着重大突破。作战文书分析模式虽然有很多方法,但是大多数学者都是在它的基础上结合词语规则和SVM模式进行研究,是目前最为有效的抽取方法。此类方法的使用主要是先利用语文中经常用到的词语规则整理出作战文书中连续出现并且相似度极高的实体,并从中提取出相关信息,两者相互磨合,能更好地与SVM模型兼容。其次,使用SVM模型对各个有效因素进行建立模型,抽取其中我们所需要的信息进行军事命名实体关系的研究。根据以上结果充分表明,如果单独使用SVM模型进行提取,其结果将不堪一击,但是如果优先利用词语规则进行提取,之后再结合SVM模型进行抽取,整个准确率和效率都会得到事半功倍的效果。 展开更多
关键词 军事命名实体 SVM模型 词语规则 实体关系抽取
在线阅读 下载PDF
一种融合实体类别特征的医疗领域关系抽取方法 被引量:1
20
作者 游新冬 赵明智 +2 位作者 王星予 徐戈 吕学强 《北京信息科技大学学报(自然科学版)》 2022年第6期19-25,共7页
关系抽取是自然语言处理中的核心任务,也是构建医疗领域知识图谱中的关键问题。现有的关系抽取方法鲜有融合实体类别的特征,针对医疗领域中实体类别的特点,提出一种融合实体类别特征的医疗领域关系抽取方法CBBS(category BERT BiLSTM Si... 关系抽取是自然语言处理中的核心任务,也是构建医疗领域知识图谱中的关键问题。现有的关系抽取方法鲜有融合实体类别的特征,针对医疗领域中实体类别的特点,提出一种融合实体类别特征的医疗领域关系抽取方法CBBS(category BERT BiLSTM Sigmoid)。首先融入实体类别特征,采用基于Transformer的双向编码器表示(bidirectional ecoder representations from Transformers,BERT)-双向长短时记忆(bidirectional long short-term memory,BiLSTM)-Sigmoid模型进行医疗关系抽取,将医疗领域关系抽取问题转化为序列标注问题,提升了单条语料中同一实体处于多种关系时的抽取效果。对比实验表明,CBBS方法在构建的医疗领域关系抽取数据集上与其他方法相比取得了最好的实验效果,精确率达到了83.97%,能够有效地解决医疗领域关系抽取问题。 展开更多
关键词 关系抽取 实体类别 BERT 序列标注 混合模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部