期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于多路局部特征整合的嵌套命名实体识别方法
1
作者 王进 蒋诗琪 《江苏大学学报(自然科学版)》 北大核心 2025年第4期431-437,共7页
为了解决嵌套命名实体识别中边界模糊和嵌套实体提取困难的问题,提出了基于多路局部特征整合的嵌套命名实体识别方法.新方法先采用双向长短时记忆网络拆解序列的正反向特征,然后按实体长度对嵌套命名实体识别任务进行拆分,使用不同大小... 为了解决嵌套命名实体识别中边界模糊和嵌套实体提取困难的问题,提出了基于多路局部特征整合的嵌套命名实体识别方法.新方法先采用双向长短时记忆网络拆解序列的正反向特征,然后按实体长度对嵌套命名实体识别任务进行拆分,使用不同大小的卷积网络对固定长度的局部信息进行整合,最后将正反向特征进行匹配得到预测结果.引入前置加权方法来解决多层模型中层间信息传递误差大的问题.将新方法与其他的嵌套命名实体识别方法在ACE2005和GENIA两个数据集上进行对比试验.结果表明:新方法在两个数据集上均表现出了更好的效果,比其他方法中最优的Dependency Parsing在ACE2005和GENIA数据集上F_(1)分数分别提升0.18和0.03百分点,新方法相比目前主流方法有一定的性能提升. 展开更多
关键词 自然语言处理 嵌套命名实体识别 深度学习 卷积神经网络 长短时记忆网络 特征融合 自适应学习
在线阅读 下载PDF
融合汉字结构和边界增强的嵌套命名实体识别方法
2
作者 陈鹏 向道岸 +1 位作者 李旭 陈世洁 《现代电子技术》 北大核心 2025年第14期108-116,共9页
嵌套的命名实体之间蕴含着丰富的语义关系和复杂的结构信息,传统的序列标记方法通常无法准确识别嵌套实体,即那些嵌套在内部的实体。为解决该问题,提出一种融合汉字结构和边界增强的嵌套命名实体识别模型BCBE-NNER。该模型首先通过循环... 嵌套的命名实体之间蕴含着丰富的语义关系和复杂的结构信息,传统的序列标记方法通常无法准确识别嵌套实体,即那些嵌套在内部的实体。为解决该问题,提出一种融合汉字结构和边界增强的嵌套命名实体识别模型BCBE-NNER。该模型首先通过循环神经网络来融合汉字结构等信息,以生成特殊的文本表示信息;其次,使用两个独立的GRU层对生成的文本表示信息进行实体头部和尾部预测,进一步加强实体的边界信息,并采用异构图神经网络进行迭代更新。结果表明:在嵌套CMeEE-V2数据集上,BCBE-NNER模型的F1值由原来的72.11%提高为74.12%,提升了2.01%;在平面Weibo NER数据集上,BCBE-NNER模型的F1值由原来的72.77%提高为75.10%,提升了2.33%。 展开更多
关键词 嵌套命名实体识别 汉字结构 边界增强 异构图神经网络 序列标记 特征融合
在线阅读 下载PDF
联合多模态与多跨度特征的嵌套命名实体识别 被引量:1
3
作者 邱云飞 邢浩然 +1 位作者 于智龙 张文文 《计算机科学与探索》 CSCD 北大核心 2024年第6期1613-1626,共14页
嵌套命名实体识别(NNER)因日趋重要的现实意义成为信息抽取的研究热点。但是,由于语料资源匮乏、穷举窗口受限以及跨度特征缺失等问题,面向垂直领域的NNER研究进展缓慢且存在实体识别错误或遗漏的问题。针对上述问题,提出一种以矿物学... 嵌套命名实体识别(NNER)因日趋重要的现实意义成为信息抽取的研究热点。但是,由于语料资源匮乏、穷举窗口受限以及跨度特征缺失等问题,面向垂直领域的NNER研究进展缓慢且存在实体识别错误或遗漏的问题。针对上述问题,提出一种以矿物学为研究背景,融合语料感知词典的垂直领域NNER模型。首先,结合点互信息、词频逆文本频率算法与注意力机制自动集成语料感知词典,同时扩展锚文本知识提升模型的训练精度。其次,从共享视角出发,设计三种多模态信息的融合策略,训练编码器学习字符、字形、词汇的扩展向量表示,通过三重积运算和切片注意力机制,筛选整合由多层感知机捕捉到的私有表征,缩小异质特征的空间差距。再次,以自底向上的层级架构确定跨度间的上下文关联,生成建议跨度集合,以双仿射机制和线性分类器获得目标跨度与相邻跨度、目标跨度内部表征、目标跨度边界等特征。最后,为目标跨度分配对应的实体类型标签。在六项数据集上的实验结果表明,相比于基线模型,提出的方法实现了显著的性能提升,能有效提升低资源场景下的NNER任务效果。 展开更多
关键词 嵌套命名实体识别 多模态 多任务 远程监督 矿物学
在线阅读 下载PDF
基于跨度边界感知的嵌套命名实体识别 被引量:4
4
作者 蔡宇翔 骆妲 +4 位作者 甘洋镭 侯睿 刘雪怡 刘峤 石晓军 《软件学报》 EI CSCD 北大核心 2024年第11期5149-5162,共14页
命名实体识别任务是信息抽取领域中的一个基础任务,旨在定位句子中实体所在位置的边界,并对该实体进行分类.针对现有基于跨度检测的模型存在的嵌套实体边界模糊问题,提出一种基于跨度边界感知的嵌套命名实体识别模型.首先,利用双仿射注... 命名实体识别任务是信息抽取领域中的一个基础任务,旨在定位句子中实体所在位置的边界,并对该实体进行分类.针对现有基于跨度检测的模型存在的嵌套实体边界模糊问题,提出一种基于跨度边界感知的嵌套命名实体识别模型.首先,利用双仿射注意力机制,捕获词元间的语义相关性,进而生成跨度语义表示矩阵;其次,通过设计一种二阶对角邻域差分算子,建立跨度语义差分机制,以提取跨度间的语义差异信息.此外,引入一种跨度边界感知机制,利用滑动窗口的局部特征提取能力,强化跨度的边界语义差异,从而准确定位实体跨度位置.为验证模型的有效性,在3个基准数据集上进行测试,包括ACE04、ACE05和Genia数据集.实验结果表明,提出的模型在实体识别准确率的表现优于相关工作.此外,还设计消融实验和案例分析以验证提出的语义差分机制和跨度边界感知机制的有效性,为进一步研究命名实体识别问题提供新的思路和实验证据. 展开更多
关键词 嵌套命名实体识别 跨度分类 差分算子 双仿射注意力机制 跨度语义感知
在线阅读 下载PDF
MKE: 基于背景知识与多头选择的嵌套命名实体识别 被引量:1
5
作者 李政 涂刚 汪汉生 《中文信息学报》 CSCD 北大核心 2024年第4期86-98,107,共14页
目前,在嵌套命名实体识别研究中,基于片段的方法将命名实体识别转化为分类问题,通过微调预训练模型,能够较好地识别嵌套实体,但仍存在领域知识缺乏和无法实现实体多分类的不足。该文提出基于知识嵌入的多头模型,用于解决这些问题。模型... 目前,在嵌套命名实体识别研究中,基于片段的方法将命名实体识别转化为分类问题,通过微调预训练模型,能够较好地识别嵌套实体,但仍存在领域知识缺乏和无法实现实体多分类的不足。该文提出基于知识嵌入的多头模型,用于解决这些问题。模型的改进包括:①引入领域背景知识,知识嵌入层以实体矩阵的形式,实现背景知识的无损嵌入;②将命名实体识别过程转化为多头选择过程,借助注意力打分模型,计算候选片段得分,最终在正确识别嵌套实体边界的同时实现实体多分类。实验结果表明,以实体矩阵方式实现的背景知识嵌入,可以有效提高识别准确率,在7个嵌套与非嵌套命名实体识别数据集上取得SOTA表现。 展开更多
关键词 嵌套命名实体识别 知识嵌入 多头选择 注意力 实体多分类
在线阅读 下载PDF
实体类别增强的汽车领域嵌套命名实体识别 被引量:1
6
作者 黄子麒 胡建鹏 《计算机应用》 CSCD 北大核心 2024年第2期377-384,共8页
针对中文汽车领域实体抽取任务中对嵌套实体、长实体识别效果差的问题,提出一种实体类别增强的嵌套实体抽取(ECE-NER)模型。首先,基于特征融合编码,提高模型对领域实体边界的感知能力;然后,尾词识别模块利用多层感知机得到实体尾词集合... 针对中文汽车领域实体抽取任务中对嵌套实体、长实体识别效果差的问题,提出一种实体类别增强的嵌套实体抽取(ECE-NER)模型。首先,基于特征融合编码,提高模型对领域实体边界的感知能力;然后,尾词识别模块利用多层感知机得到实体尾词集合;最后,前向边界识别模块基于义原构造的实体类别特征和自注意力机制得到实体类别增强的候选尾词表征,融合领域实体类别特征,利用双仿射编码器计算特定尾词和实体类型的实体跨度概率,从而确定命名实体。在某汽车企业生产线故障数据集、汽车工业故障抽取评测数据集CCL2022和中文医学文本数据集CHIP2020上进行模型验证。实验结果表明,所提模型在前两个数据集上的实体识别F1值比序列标注模型(BERT+BiLSTM+CRF)、基于跨度的实体抽取模型(PURE(Princeton University Relation Extraction)、SpERT(Span-based Entity and Relation Transformer))分别提高了4.1、1.8、1.6个百分点和9.0、5.4、7.3个百分点;在第一个数据集和第三个数据集中嵌套实体识别F1值与PURE、SpERT模型相比提高了13.3、8.3个百分点和21.7、9.3个百分点,验证了所提模型在嵌套实体识别上的有效性。 展开更多
关键词 特征融合 义原特征 自注意力机制 双仿射编码器 中文嵌套命名实体识别
在线阅读 下载PDF
基于跨度解码的嵌套命名实体识别方法
7
作者 念永明 陈艳平 +1 位作者 秦永彬 黄瑞章 《计算机工程与应用》 CSCD 北大核心 2024年第1期174-181,共8页
跨度分类是嵌套命名实体识别常用的方法,但由于需要穷举并验证每一个跨度,存在高复杂度和数据不平衡的问题。并且,由于对每个跨度是单独进行预测,忽视了文本序列中存在的实体间的依赖关系。针对跨度分类方法存在的上述问题,提出了一种... 跨度分类是嵌套命名实体识别常用的方法,但由于需要穷举并验证每一个跨度,存在高复杂度和数据不平衡的问题。并且,由于对每个跨度是单独进行预测,忽视了文本序列中存在的实体间的依赖关系。针对跨度分类方法存在的上述问题,提出了一种基于跨度解码的嵌套命名实体识别方法。结合词性特征、字符特征、词特征以及上下文特征对文本进行编码,获取文本丰富的语义信息;识别可能的实体开始位置,在此基础上穷举可能的实体跨度,一定程度地减少潜在的实体跨度;使用基于注意力机制的解码器逐一对每个开始所对应的实体跨度的类型进行预测,解码过程中将已预测的实体信息进行传递,进而捕获和学习实体间的依赖关系。实验结果表明,跨度解码可以有效地改进跨度分类,所提出的方法在公共的英语嵌套实体数据集ACE2005和GENIA上的F1分数分别提高了0.45和0.14个百分点。 展开更多
关键词 嵌套命名实体识别 跨度分类 编解码 神经网络
在线阅读 下载PDF
基于位置嵌入和多级预测的中文嵌套命名实体识别 被引量:2
8
作者 段建勇 朱奕霏 +2 位作者 王昊 何丽 李欣 《计算机工程》 CAS CSCD 北大核心 2023年第12期71-77,共7页
针对传统中文嵌套命名实体识别模型通常存在实体边界难以准确定位及中文字符与词汇之间边界模糊的问题,构建一种基于位置嵌入和多级结果边界预测的嵌套命名实体识别模型。在嵌入层,将嵌套实体位置信息与文本位置信息同时编码后生成绝对... 针对传统中文嵌套命名实体识别模型通常存在实体边界难以准确定位及中文字符与词汇之间边界模糊的问题,构建一种基于位置嵌入和多级结果边界预测的嵌套命名实体识别模型。在嵌入层,将嵌套实体位置信息与文本位置信息同时编码后生成绝对位置序列,通过关注中文文本中自带的位置信息,进一步挖掘嵌套实体与字符之间的关系,并且增强了嵌套实体与原始文本之间的联系。在编码层,利用排除最优路径的隐藏矩阵实现嵌套实体的初步识别。在解码层,计算实体边界的偏移量,重新确定实体边界,从而提高中文嵌套实体识别准确率。实验结果表明,在医疗和日常两个领域的数据集上,该模型的准确率、召回率、F1值相比于基线模型中的最优值分别提高了0.34、1.06、0.80和11.90、0.78、6.23个百分点,具有较好的识别性能。 展开更多
关键词 嵌套命名实体识别 位置嵌入 边界预测单元 条件随机场 多级预测
在线阅读 下载PDF
基于交互式特征融合的嵌套命名实体识别 被引量:3
9
作者 廖涛 黄荣梅 +1 位作者 张顺香 段松松 《计算机工程》 CAS CSCD 北大核心 2022年第12期119-126,133,共9页
现有命名实体识别模型在字嵌入过程中多采用字符向量、字向量等不同单词表示向量的拼接或累加方式提取信息,未考虑不同单词表示特征之间的相互依赖关系,导致单词内部特征信息获取不足。提出一种基于交互式特征融合的嵌套命名实体识别模... 现有命名实体识别模型在字嵌入过程中多采用字符向量、字向量等不同单词表示向量的拼接或累加方式提取信息,未考虑不同单词表示特征之间的相互依赖关系,导致单词内部特征信息获取不足。提出一种基于交互式特征融合的嵌套命名实体识别模型,通过交互的方式构建不同特征之间的通信桥梁,以捕获多特征之间的依赖关系。采用交互机制得到包含不同单词表示信息的字嵌入向量,基于双向长短时记忆网络提取单词的表示特征,并对不同单词的表示特征进行交互,捕获特征之间的相互依赖关系。为进一步提取序列特征的上下文信息,采用基于特征交互的多头注意力机制捕获句子上下文的依赖关系。在此基础上,采用二元序列标记法过滤非实体区域,得到粗粒度候选区间,并对其进行细粒度划分以判断实体类别。实验结果表明,该模型的召回率和F1值为72.4%和71.2%,相比现有的嵌套命名实体识别模型,F1值平均提高了1.72%。 展开更多
关键词 嵌套命名实体识别 双向长短时记忆网络 特征交互 多头注意力 候选区间
在线阅读 下载PDF
FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法 被引量:4
10
作者 陈鹏 马洪彬 +2 位作者 周佳伦 李琳宇 余肖生 《重庆理工大学学报(自然科学)》 CAS 北大核心 2023年第12期222-231,共10页
基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题。而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳。为了解决这一问题,... 基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题。而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳。为了解决这一问题,提出了融合字形信息的基于跨度的中文嵌套命名实体识别算法——FCG-NNER,首先通过卷积神经网络获取汉字的字形信息,其次通过交叉Biaffine双仿射解码层实现原文信息与字形信息融合,然后通过对角融合CNN层获取不同跨度之间的局部相互作用,最后将交叉Biaffine双仿射解码层的输出与对角融合CNN层的输出相加后输入到全连接层中,得到最终的预测结果。采用2个具有代表性的中文嵌套NER数据集(CMeEE和CLUENER2020)用于实验验证。结果显示,FCG-NNER在CMeEE数据集中的精度为65.02%,召回率为67.93%,F1值达到0.664 4;在CLUENER2020数据集中的精度为79.45%,召回率为82.33%,F1值达到0.808 6,证明FCG-NNER算法的性能明显超过2个数据集的基线。 展开更多
关键词 中文嵌套命名实体识别 字形特征 跨度分类 特征融合
在线阅读 下载PDF
基于分层标注的中文嵌套命名实体识别 被引量:9
11
作者 金彦亮 谢晋飞 吴迪嘉 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期270-280,共11页
中文命名实体识别在中文信息处理中扮演着重要的角色.在中文信息文本中,许多命名实体内部包含着嵌套实体.然而,已有研究大多聚焦在非嵌套实体识别,无法充分捕获嵌套实体之间的边界信息.采用分层标注方式进行嵌套命名实体识别(nested nam... 中文命名实体识别在中文信息处理中扮演着重要的角色.在中文信息文本中,许多命名实体内部包含着嵌套实体.然而,已有研究大多聚焦在非嵌套实体识别,无法充分捕获嵌套实体之间的边界信息.采用分层标注方式进行嵌套命名实体识别(nested named entity recognition,NNER),将每层的实体识别解析为一个单独的任务,并通过Gate过滤机制来促进层级之间的信息交换.利用公开的1998年《人民日报》NNER语料进行了多组实验,验证了模型的有效性.实验结果表明,在不使用外部资源词典信息的情况下,该方法在《人民日报》数据集上的F1值达到了91.41%,有效提高了中文嵌套命名实体识别的效果. 展开更多
关键词 中文信息处理 分层标注 嵌套命名实体识别 Gate过滤机制
在线阅读 下载PDF
基于联合模型的中文嵌套命名实体识别 被引量:8
12
作者 尹迪 周俊生 曲维光 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2014年第3期29-35,共7页
中文嵌套命名实体识别是自然语言处理中一个比较困难的问题.针对传统的序列化标注方法的不足,本文提出了一种新的基于联合模型的中文嵌套命名实体识别方法,该方法将嵌套命名实体识别看作是一种联合切分和标注任务.联合模型用一种改进的b... 中文嵌套命名实体识别是自然语言处理中一个比较困难的问题.针对传统的序列化标注方法的不足,本文提出了一种新的基于联合模型的中文嵌套命名实体识别方法,该方法将嵌套命名实体识别看作是一种联合切分和标注任务.联合模型用一种改进的beam search算法作为系统的解码算法,并采用一种在线学习算法平均感知器算法作为训练算法,获得了较快的收敛速度和较好的识别效果.实验结果表明基于联合模型的方法对嵌套命名实体识别取得了更好的效果. 展开更多
关键词 嵌套命名实体识别 序列化标注模型 联合模型 感知器算法
在线阅读 下载PDF
中文嵌套命名实体识别语料库的构建 被引量:14
13
作者 李雁群 何云琪 +1 位作者 钱龙华 周国栋 《中文信息学报》 CSCD 北大核心 2018年第8期19-26,共8页
嵌套命名实体含有丰富的实体和实体间语义关系,有助于提高信息抽取的效率。由于缺少统一的标准中文嵌套命名实体语料库,目前中文嵌套命名实体的研究工作难于比较。该文在已有命名实体语料的基础上采用半自动化方法构建了两个中文嵌套命... 嵌套命名实体含有丰富的实体和实体间语义关系,有助于提高信息抽取的效率。由于缺少统一的标准中文嵌套命名实体语料库,目前中文嵌套命名实体的研究工作难于比较。该文在已有命名实体语料的基础上采用半自动化方法构建了两个中文嵌套命名实体语料库。首先利用已有中文命名实体语料库中的标注信息自动地构造出尽可能多的嵌套命名实体,然后再进行手工调整以满足对中文嵌套实体的标注要求,从而构建高质量的中文嵌套命名实体识别语料库。语料内和跨语料嵌套实体识别的初步实验表明,中文嵌套命名实体识别仍是一个比较困难的问题,需要进一步研究。 展开更多
关键词 中文嵌套命名实体识别 条件随机场 信息抽取 语料库
在线阅读 下载PDF
基于分层ERNIE模型的中文嵌套命名实体识别 被引量:5
14
作者 贾李睿智 刘胜全 +3 位作者 刘源 魏富源 孔博 王光耀 《东北师大学报(自然科学版)》 CAS 北大核心 2023年第1期97-103,共7页
近年来中文嵌套命名实体识别的相关研究进展缓慢,BERT和RoBERTa等预训练模型在处理中文语言时,导致模型只能学习到不完整的语义表示.针对以上两个问题,首先使用现有的中文命名实体基准语料库ACE2004和ACE2005,依照原始语料的中心词和外... 近年来中文嵌套命名实体识别的相关研究进展缓慢,BERT和RoBERTa等预训练模型在处理中文语言时,导致模型只能学习到不完整的语义表示.针对以上两个问题,首先使用现有的中文命名实体基准语料库ACE2004和ACE2005,依照原始语料的中心词和外延的关系自动构造嵌套命名实体;然后使用分层ERNIE模型在构建好的中文语料库上进行中文嵌套命实体识别的研究,相较于BERT等模型,ERNIE模型则是通过对中文实体语义单元的掩码,使得模型学习完整概念的语义表示.实验结果表明,分层ERNIE模型在ACE2004和ACE2005两个中文嵌套命名实体语料库上F1值分别为84.5%和85.9%,性能优于BERT和RoBERTa模型. 展开更多
关键词 嵌套命名实体识别 中文嵌套实体语料库 ERNIE 预训练模型
在线阅读 下载PDF
基于词融合与跨度检测的中文嵌套命名实体识别 被引量:2
15
作者 陈淑振 窦全胜 +1 位作者 唐焕玲 姜平 《计算机应用研究》 CSCD 北大核心 2023年第8期2382-2386,2392,共6页
目前中文命名实体识别模型在识别具有嵌套结构的实体时存在误差,无法准确识别。基于跨度的方法能够找出嵌套实体,但在识别过程中经常生成不包含实体的跨度,无法明确划分跨度边界,增加模型负担。针对此问题,提出了基于词汇融合与跨度边... 目前中文命名实体识别模型在识别具有嵌套结构的实体时存在误差,无法准确识别。基于跨度的方法能够找出嵌套实体,但在识别过程中经常生成不包含实体的跨度,无法明确划分跨度边界,增加模型负担。针对此问题,提出了基于词汇融合与跨度边界检测的中文嵌套命名实体识别模型。该模型使用多词融合方法达到文本特征增强的目的,在设计的注入模块中将目标语句中字符相关的多个词汇信息进行合并,之后融入到BERT中,以此获得更全面的上下文信息,提供更好的跨度表示;其次添加跨度边界检测模块,通过感知分类器预测跨度的首尾字符来划分跨度边界。在公共数据集上的实验表明,该模型可有效提升识别准确率。 展开更多
关键词 中文嵌套命名实体识别 BERT模型 多词融合 跨度边界检测
在线阅读 下载PDF
基于多核卷积神经网络(BERT+Multi-CNN+CRF)的水产医学嵌套命名实体识别 被引量:13
16
作者 刘巨升 于红 +5 位作者 杨惠宁 邵立铭 宋奇书 李光宇 张思佳 孙华 《大连海洋大学学报》 CAS CSCD 北大核心 2022年第3期524-530,共7页
为解决水产医学命名实体识别中存在的嵌套实体识别准确率不高的问题,提出一种基于多核卷积的命名实体识别模型(BERT+Multi-CNN+CRF),采用多核卷积神经网络提取嵌套实体特征,通过BERT(bidirectional encoder representations from transf... 为解决水产医学命名实体识别中存在的嵌套实体识别准确率不高的问题,提出一种基于多核卷积的命名实体识别模型(BERT+Multi-CNN+CRF),采用多核卷积神经网络提取嵌套实体特征,通过BERT(bidirectional encoder representations from transformers)方法对输入语料进行预训练,丰富嵌套实体位置向量信息,获得嵌套实体输入特征矩阵,将提取特征矩阵与输入特征矩阵融合,以增强嵌套实体的特征表示,并进行不同模型的对比试验。结果表明,本文中提出的BERT+Multi-CNN+CRF模型,在水产医学嵌套命名实体识别任务中的准确率、召回率和F1值分别为88.04%、88.92%和88.48%,与识别准确率较高的BERT+BiLSTM+ATT+CRF模型相比,分别提高了2.25%、3.23%和2.74%。研究表明,本文中提出的BERT+Multi-CNN+CRF模型可有效解决水产医学嵌套实体识别准确率不高的问题,是一种有效的水产医学嵌套命名实体识别方法。 展开更多
关键词 水产医学 BERT 嵌套命名实体识别 卷积神经网络 多卷积核
在线阅读 下载PDF
用于嵌套命名实体识别的边界强化分类模型 被引量:2
17
作者 连艺谋 张英俊 谢斌红 《计算机工程》 CAS CSCD 北大核心 2022年第8期313-320,共8页
实体嵌套是自然语言中一种常见现象,提高嵌套命名实体识别的准确性对自然语言处理各项任务具有重要作用。针对现有嵌套命名实体识别方法在识别实体边界时不够准确、未能有效利用实体边界信息等问题,提出一种嵌套命名实体识别的边界强化... 实体嵌套是自然语言中一种常见现象,提高嵌套命名实体识别的准确性对自然语言处理各项任务具有重要作用。针对现有嵌套命名实体识别方法在识别实体边界时不够准确、未能有效利用实体边界信息等问题,提出一种嵌套命名实体识别的边界强化分类模型。采用卷积神经网络提取邻接词的特征,通过加入多头注意力的序列标注模型获取实体中的边界特征,提高实体边界检测的准确性。在此基础上,计算实体中各词语对实体类型的贡献度,将实体关键字与实体边界词相结合来表示实体,使实体表示中包含实体关键信息和边界信息,最后进行实体类型检测。实验结果表明,通过加入多头注意力机制能够有效提升对嵌套命名实体的检测和识别性能,该模型在GENIA和GermEval 2014数据集上准确率有较好表现,并且召回率和F1值较对比模型达到最优。 展开更多
关键词 嵌套命名实体识别 实体表示 注意力机制 边界 神经网络
在线阅读 下载PDF
基于维基百科的中文嵌套命名实体识别语料库自动构建 被引量:7
18
作者 李雁群 何云琪 +1 位作者 钱龙华 周国栋 《计算机工程》 CAS CSCD 北大核心 2018年第11期76-82,共7页
传统的监督学习方法需要标注一定规模的领域内语料库,限制了其领域适应性。为此,提出一种从中文维基百科条目中自动构建中文嵌套命名实体识别语料库的方法。对中文维基百科的条目进行实体分类,利用实体条目构造实体的嵌套结构,从而自动... 传统的监督学习方法需要标注一定规模的领域内语料库,限制了其领域适应性。为此,提出一种从中文维基百科条目中自动构建中文嵌套命名实体识别语料库的方法。对中文维基百科的条目进行实体分类,利用实体条目构造实体的嵌套结构,从而自动生成大规模的中文嵌套命名实体识别语料库。在手工标注嵌套命名实体识别语料库上的实验结果表明,自动构建的语料库具有规模较大、领域广的特点,且能够适应宽泛领域上的中文嵌套命名实体识别任务。 展开更多
关键词 嵌套命名实体识别 信息抽取 维基百科 语料库 条件随机场
在线阅读 下载PDF
导弹领域文本嵌套命名实体识别方法研究 被引量:5
19
作者 关景文 宋晓 +2 位作者 李晓庆 杨彤 周军华 《系统仿真学报》 CAS CSCD 北大核心 2023年第8期1757-1767,共11页
常规领域文本识别相对容易,而专业术语存在大量嵌套命名实体,识别难度大,是构建航空航天领域知识图谱的核心挑战之一。现有的命名实体识别技术多采用双向长短记忆网络加条件随机场(BiLSTM-CRF)识别实体,很难区分导弹领域术语的嵌套、交... 常规领域文本识别相对容易,而专业术语存在大量嵌套命名实体,识别难度大,是构建航空航天领域知识图谱的核心挑战之一。现有的命名实体识别技术多采用双向长短记忆网络加条件随机场(BiLSTM-CRF)识别实体,很难区分导弹领域术语的嵌套、交叉等复杂关系。为解决这一难题,在对领域文本进行嵌套实体标注的基础上,提出一种融合语言学特征、基于机器阅读理解的嵌套命名实体识别方法,引入先验知识、改变解码方式,以问答形式进行多任务预测。实验表明:所提方法能有效提高导弹领域文本嵌套实体识别的准确率和召回率,其综合指标F1值相较于基于BiLSTM-CRF的嵌套命名实体识别方法提高了13.89%。 展开更多
关键词 导弹 嵌套命名实体识别 知识抽取 机器阅读理解 语言学特征
在线阅读 下载PDF
基于分割注意力与边界感知的中文嵌套命名实体识别算法 被引量:3
20
作者 张汝佳 代璐 +1 位作者 郭鹏 王邦 《计算机科学》 CSCD 北大核心 2023年第1期213-220,共8页
由于中文文本缺少天然分隔符,中文嵌套命名实体识别(Chinese Nested Named Entity Recognition,CNNER)任务极具挑战性,而嵌套结构的复杂性和多变性更增添了任务的难度。文中针对CNNER任务提出了一种新型边界感知层叠神经网络模型(Bounda... 由于中文文本缺少天然分隔符,中文嵌套命名实体识别(Chinese Nested Named Entity Recognition,CNNER)任务极具挑战性,而嵌套结构的复杂性和多变性更增添了任务的难度。文中针对CNNER任务提出了一种新型边界感知层叠神经网络模型(Boundary-aware Layered Nerual Model,BLNM)。首先通过构建了一个分割注意力网络来捕获潜在的分词信息和相邻字符之间的语义关系,以增强字符表示;然后通过动态堆叠扁平命名实体识别层的网络,由小粒度到大粒度逐层识别嵌套实体;最后为了利用被预测实体的边界信息和位置信息,构建了一个边界生成式模块,用于连接相邻的扁平命名实体识别层以及缓解错误传递问题。基于ACE 2005中文嵌套命名实体数据集的实验结果表明,该模型具有较好的性能。 展开更多
关键词 中文嵌套命名实体识别 分割注意力 边界生成式 层叠神经网络
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部