期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
融合分段式位置信息的图卷积中文关系抽取
1
作者 王婷婷 韩虎 +1 位作者 何勇禧 孔博 《计算机工程与应用》 北大核心 2025年第16期187-195,共9页
关系抽取任务旨在识别句子中实体间的语义关系。针对中文关系抽取任务中语义信息挖掘不充分以及引入语法依赖产生的噪声问题,提出一种融合分段式位置信息的图卷积中文关系抽取模型。一方面引入实体的位置信息,在初始文本上添加相对位置... 关系抽取任务旨在识别句子中实体间的语义关系。针对中文关系抽取任务中语义信息挖掘不充分以及引入语法依赖产生的噪声问题,提出一种融合分段式位置信息的图卷积中文关系抽取模型。一方面引入实体的位置信息,在初始文本上添加相对位置编码,通过分段卷积神经网络将实体位置信息集成到局部特征中,并引入门控注意力机制构建注意力权重矩阵,捕获全局语义特征。另一方面通过语法剪枝规则构建局部语法依赖图捕获语法信息,去除与特定实体语法距离较远且无关的分支来避免噪声干扰。最后采用门控机制动态融合不同粒度的语义信息,实现不同类型信息的共享与互补。在三个公开中文数据集SanWen、FinRE和COAE2016上的实验结果表明,该模型可以有效捕获语义语法信息,对比基线模型表现出了较好的性能。 展开更多
关键词 中文关系抽取 图卷积网络 分段式位置信息 语法剪枝 门控注意力
在线阅读 下载PDF
基于实体级联类型的中文关系抽取管道模型
2
作者 饶东宁 吴倩梅 黄观琚 《计算机应用研究》 CSCD 北大核心 2024年第9期2685-2689,共5页
端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时... 端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时具有多个类型,这种多义性的情况在中文数据集中尤为常见。为解决上述问题,提出了一种实体级联类型机制,并在此基础上开发了一个更适合中文关系抽取的管道模型,取名为CENTRELINE。该流水线方法的实体模块是一个词-词关系分类模型,它以BERT和双向LSTM作为编码器、经过条件层归一化后引入空洞卷积,最后通过级联类型预测器输出实体及其级联类型。关系模块的输入仅由实体模块构建。该方法在DuIE1.0、DuIE2.0和CMeIE-V2数据集上的F_(1)值分别比基线方法提高了7.23、6.93和8.51百分点,并在DuIE1.0和DuIE2.0数据集上都实现了最先进的性能。消融实验表明,提出的级联类型机制和根据中文语言特征改进的管道模型,均对关系抽取性能具有明显的促进作用。 展开更多
关键词 中文关系抽取 管道模型 空洞卷积 实体级联类型
在线阅读 下载PDF
基于语言模型增强的中文关系抽取方法 被引量:5
3
作者 薛平 李影 吴中海 《中文信息学报》 CSCD 北大核心 2023年第7期32-41,共10页
中文关系抽取任务旨在识别中文文本中实体对的语义关系。基于预训练语言模型的方法达到了当前最优结果。得益于大规模的训练语料,预训练语言模型能够学习到训练语料中的语言知识,提高了中文关系抽取模型的泛化能力,但其庞大的参数规模... 中文关系抽取任务旨在识别中文文本中实体对的语义关系。基于预训练语言模型的方法达到了当前最优结果。得益于大规模的训练语料,预训练语言模型能够学习到训练语料中的语言知识,提高了中文关系抽取模型的泛化能力,但其庞大的参数规模需要消耗大量的存储和计算资源。为此,该文提出了基于语言模型增强的中文关系抽取方法,该方法基于多任务学习范式,促进轻量级的中文关系抽取模型学习预训练语言模型中的语言知识。该文在三个中文关系抽取数据集上的实验结果表明了基于语言模型增强的中文关系抽取方法的有效性,仅使用预训练语言模型1%的参数即可达到其95%的性能。 展开更多
关键词 中文关系抽取 预训练语言模型 语言模型增强
在线阅读 下载PDF
基于短语成分表示的中文关系抽取 被引量:1
4
作者 刘娜娜 程婧 +3 位作者 闵可锐 康昱 王新 周扬帆 《数据采集与处理》 CSCD 北大核心 2020年第3期449-457,共9页
关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息。然而目前短语成分应用于关系抽取任务时没有明显效果。这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成... 关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息。然而目前短语成分应用于关系抽取任务时没有明显效果。这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成错误传播,从而影响了它对关系抽取的有效性;关系抽取任务上使用短语成分特征的方式存在缺陷,即丧失短语成分分析学习到的句子结构信息,或者加大其对关系抽取的错误影响。本文在提升短语成分分析效果的基础上,提出了基于短语成分表示的中文关系抽取方法。该方法将短语成分分析模型学习到的文本表示嵌入到关系抽取模型中,从而提升关系抽取的性能。本文在公开的中文关系抽取数据集上验证了该方法的有效性。 展开更多
关键词 短语成分表示 中文关系抽取 特征融合 短语成分分析
在线阅读 下载PDF
基于关系过滤和实体对标注的中文关系抽取方法 被引量:1
5
作者 刘旭 杨航 +1 位作者 张啸成 张永刚 《吉林大学学报(理学版)》 CAS 北大核心 2023年第5期1095-1102,共8页
针对关系三元组抽取任务中的冗余关系问题和实体重叠问题,提出一种基于关系过滤器的二维实体对标注方案(RF2DTagging).RF2DTagging模型由两部分组成:1)用于过滤冗余关系的关系过滤器(relation filter);2)能有效解决各种实体重叠问题的... 针对关系三元组抽取任务中的冗余关系问题和实体重叠问题,提出一种基于关系过滤器的二维实体对标注方案(RF2DTagging).RF2DTagging模型由两部分组成:1)用于过滤冗余关系的关系过滤器(relation filter);2)能有效解决各种实体重叠问题的二维实体对标注方案(2D entity-pair tagging scheme).为进一步验证RF2DTagging模型,在3个公开的中文关系抽取数据集(CCKS2019-Task3,CMeIE和DuIE2.0)上进行实验.实验结果表明,该模型能有效解决上述两个问题,且总体性能比对比模型更好. 展开更多
关键词 中文关系抽取 知识图谱 二维实体对标注 自然语言处理
在线阅读 下载PDF
基于双重注意力机制的远程监督中文关系抽取 被引量:11
6
作者 车金立 唐力伟 +1 位作者 邓士杰 苏续军 《计算机工程与应用》 CSCD 北大核心 2019年第20期107-113,共7页
相比于传统有监督的中文关系抽取方法,基于远程监督的方法可极大地避免训练语料匮乏的问题,因此得到了广泛关注。然而,远程监督方法的性能却严重受困于构建语料过程中引入的错误标签,因此为缓解噪声数据所带来的影响,提出一种基于双重... 相比于传统有监督的中文关系抽取方法,基于远程监督的方法可极大地避免训练语料匮乏的问题,因此得到了广泛关注。然而,远程监督方法的性能却严重受困于构建语料过程中引入的错误标签,因此为缓解噪声数据所带来的影响,提出一种基于双重注意力机制的关系抽取模型。该模型可通过双向门限循环单元(Bidirectional Gated Recurrent Unit,BI-GRU)网络获取训练实例的双向上下文语义信息,并利用字符级注意力机制关注实例中重要的语义特征,同时在多个实例间引入实例级注意力机制计算实例与对应关系的相关性,以降低噪声数据的权重。在基于互动百科构建的中文人物关系抽取语料上的实验结果表明,该模型相比于单注意力机制模型可有效利用实例中所包含的语义信息并降低错误标签实例的影响,获取更高的准确率。 展开更多
关键词 中文关系抽取 远程监督 双重注意力机制 双向门限循环单元(BI-GRU) 互动百科
在线阅读 下载PDF
中文重叠关系抽取的动态分层级联标记模型 被引量:2
7
作者 张利 张欢欢 袁玉波 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期450-458,共9页
构建了动态分层级联标记中文重叠关系抽取(RWG-LSA)模型:首先基于预训练语言模型和gated机制构建了动态字词融合特征学习模型(RWG),有效避免了主体标记模块的特征缺失和无法并行计算等问题;其次引入动态权局部自注意力(LSA),自主学习到... 构建了动态分层级联标记中文重叠关系抽取(RWG-LSA)模型:首先基于预训练语言模型和gated机制构建了动态字词融合特征学习模型(RWG),有效避免了主体标记模块的特征缺失和无法并行计算等问题;其次引入动态权局部自注意力(LSA),自主学习到主体层面的语义特征;最后在有效融合了输入序列的全局和主体局部特征的基础上,实现RWG-LSA模型对文本中实体对和关系的抽取。在SKE中文数据集上的实验表明,本模型对重叠关系抽取有显著效果,F1值达到了82.44%。 展开更多
关键词 文本挖掘 中文重叠关系抽取 动态字词融合 预训练语言模型 gated机制 局部自注意力机制
在线阅读 下载PDF
基于双向GRU神经网络和双层注意力机制的中文文本中人物关系抽取研究 被引量:24
8
作者 张兰霞 胡文心 《计算机应用与软件》 北大核心 2018年第11期130-135,189,共7页
实体关系抽取是知识抽取的重要组成部分。与传统模式识别的方法相比,深度学习的方法在关系抽取任务中表现得更为突出。目前关于中文的关系抽取技术的研究主要是基于核函数和远程监督的方法,而且数据集中的噪音数据对实验结果带来的负面... 实体关系抽取是知识抽取的重要组成部分。与传统模式识别的方法相比,深度学习的方法在关系抽取任务中表现得更为突出。目前关于中文的关系抽取技术的研究主要是基于核函数和远程监督的方法,而且数据集中的噪音数据对实验结果带来的负面影响不可忽视。提出一种基于双向GRU神经网络和双层注意力机制的中文关系抽取模型。结合中文语言的结构特点,采用字向量的形式进行输入,针对遗忘性问题,采用双向的GRU神经网络对输入向量进行融合。从一个句子中提取出字级别的特征信息,并通过句子级别的注意力机制来提取句子特征。利用远程监督的方法在新闻网站上抽取约8 000条数据进行验证。实验结果表明,双层注意力机制的神经网络模型可以充分利用句子的所有特征信息,准确率和召回率相较于未加入注意力机制的神经网络模型都有显著提升。 展开更多
关键词 中文关系抽取 双向GRU神经网络 注意力机制 字向量
在线阅读 下载PDF
《同义词词林》在中文实体关系抽取中的作用 被引量:28
9
作者 刘丹丹 彭成 +1 位作者 钱龙华 周国栋 《中文信息学报》 CSCD 北大核心 2014年第2期91-99,共9页
语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了... 语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了词汇语义信息和实体类型信息之间的冗余性。在ACE2005中文语料库上的关系抽取实验表明,在未知实体类型的前提下,语义信息能显著提高抽取性能;而在已知实体类型的情况下,语义信息也能明显提高某些关系类型的抽取性能,这说明《词林》语义信息和实体类型信息在中文语义关系抽取中具有一定的互补性。 展开更多
关键词 中文实体关系抽取 树核函数 同义词词林 语义信息
在线阅读 下载PDF
词汇语义信息对中文实体关系抽取影响的比较 被引量:11
10
作者 刘丹丹 彭成 +1 位作者 钱龙华 周国栋 《计算机应用》 CSCD 北大核心 2012年第8期2238-2244,共7页
提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程... 提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程度上提高中文关系抽取的性能;同时,《同义词词林》能补充实体类型信息的不足,因而无论是否加入实体类型信息,其语义信息都能大幅度地提高大部分关系类型的抽取性能;而《知网》则和实体类型信息存在冲突,因此在已知实体类型信息的前提下,仅能提高个别关系类型的抽取性能。 展开更多
关键词 中文实体关系抽取 树核 《同义词词林》 《知网》 语义信息
在线阅读 下载PDF
基于合一句法和实体语义树的中文语义关系抽取 被引量:19
11
作者 虞欢欢 钱龙华 +1 位作者 周国栋 朱巧明 《中文信息学报》 CSCD 北大核心 2010年第5期17-23,共7页
该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高... 该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高中文语义关系抽取的性能。在ACE RDC 2005中文基准语料上进行的关系探测和关系抽取的实验表明,该方法能显著提高中文语义关系抽取性能,大类抽取的最佳F值达到67.0,这说明结构化句法信息和实体语义信息在中文语义关系抽取中具有互补性。 展开更多
关键词 中文语义关系抽取 卷积树核函数 实体语义信息
在线阅读 下载PDF
基于核方法的中文实体关系抽取研究 被引量:19
12
作者 黄瑞红 孙乐 +1 位作者 冯元勇 黄云平 《中文信息学报》 CSCD 北大核心 2008年第5期102-108,共7页
命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改... 命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。 展开更多
关键词 计算机应用 中文信息处理 中文实体关系抽取 核方法 卷积树核 复合核 最短路径依赖核
在线阅读 下载PDF
基于依存分析的开放式中文实体关系抽取方法 被引量:29
13
作者 李明耀 杨静 《计算机工程》 CAS CSCD 北大核心 2016年第6期201-207,共7页
实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提... 实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提出一种开放式中文实体关系抽取方法。对输入的单句进行依存分析,通过依存分析输出的依存弧判断单句是否为动词谓语句,如果是动词谓语句则结合中文语法启发式规则抽取关系表述。根据距离确定论元位置,对三元组进行评估,输出符合条件的三元组。在Sogou CA和Sogou CS语料库上的实验结果表明,提出的方法适用于大规模语料库,具有较好的性能与可移植性。与基于卷积树核的无监督层次聚类方法相比,F值提高了16.68%。 展开更多
关键词 开放式信息抽取 中文实体关系抽取 依存分析 无监督 启发式规则
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部