期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
面向中文病历的实体关系抽取模型研究 被引量:1
1
作者 单涛 许鑫 +4 位作者 王园梦 王宇翱 景慎旗 叶继元 郭永安 《现代情报》 北大核心 2025年第5期24-33,共10页
[目的/意义]关系抽取是电子病历处理的核心组成部分,对于提高电子病历处理的准确性和效率至关重要。为解决中文电子病历关系抽取中实体冗余、实体词嵌套和实体重叠问题,提高医疗信息抽取效率,提出了一种新型的中文病历关系抽取模型。[方... [目的/意义]关系抽取是电子病历处理的核心组成部分,对于提高电子病历处理的准确性和效率至关重要。为解决中文电子病历关系抽取中实体冗余、实体词嵌套和实体重叠问题,提高医疗信息抽取效率,提出了一种新型的中文病历关系抽取模型。[方法/过程]将关系抽取任务分解为关系优先解码器、全局实体提取和主体—客体对齐三部分。首先通过解码器预测和过滤关系,并基于预测的关系限制实体提取;其次采用关系特定的注意机制和全局指针网络,有效处理信息重叠和主体/客体嵌套问题;最后引入实体对应矩阵将主体、客体及其关系对齐为三元组。[结果/结论]分别在CMeIE中文病历数据集和DiaKG真实糖尿病中文数据集上进行综合实验并与6种常用模型进行了对比分析,发现本文模型在数据集CMeIE和DiaKG上的F1值较主流模型CasRel分别提升了6.6%和5.8%。研究结果表明,本文模型可有效解决中文病历复杂性带来的实体嵌套和实体重叠问题,对医疗信息提取和数据处理流程具有良好价值。 展开更多
关键词 关系抽取 中文病例 电子病例 实体嵌套 实体重叠 注意力机制 全局指针 糖尿病
在线阅读 下载PDF
基于全局指针限定窗口的中文医学实体识别
2
作者 仇家康 张卫山 +2 位作者 陈涛 张宝宇 朱宜昌 《计算机工程与设计》 北大核心 2025年第9期2586-2591,共6页
针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减... 针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减少长冗余负样本对模型训练的干扰。为降低模型对样本顺序的敏感性,采用最优自蒸馏策略,使模型学习到更高质量的知识和特征表示。实验结果表明,该模型在4个公开数据集上的性能均显著高于基线模型。 展开更多
关键词 实体识别 中文医学 模型蒸馏 文本挖掘 全局指针 神经网络 深度学习
在线阅读 下载PDF
融合与高效全局指针网络的电力变压器缺陷文本实体识别方法
3
作者 林蔚青 郑垂锭 +4 位作者 陈静 江灏 肖洒 王铭海 缪希仁 《电网技术》 北大核心 2025年第11期4876-4887,共12页
电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种... 电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种融合乱序语言模型预训练BERT(pre-training BERT with permuted language model,PERT)与高效全局指针(efficient global pointer,EGP)网络的电力变压器缺陷文本实体识别方法。首先,在大规模中文语料库上利用乱序语言模型进行预训练以形成PERT模型。其次,PERT作为语义编码层,以深入挖掘实体内部的语义依赖关系,并捕捉复杂文本中的语言特征;EGP作为信息解码层,专注于精确定位关键信息并提取实体在缺陷文本中的分布特征,进而准确识别缺陷实体。最后,运用PERT-EGP模型识别缺陷文本中包含的缺陷设备、缺陷部件、缺陷部位、缺陷现象和缺陷程度5类实体。算例结果表明,相较于现有方法,该方法不仅在成分复杂的复合实体和长文本上效果提升显著,而且大幅缩短模型训练时间,具有更好的文本识别性能。 展开更多
关键词 缺陷文本 变压器 实体识别 乱序语言模型 高效全局指针网络
在线阅读 下载PDF
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:2
4
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于增量预训练与对抗学习的古籍命名实体识别
5
作者 任乐 张仰森 +2 位作者 李剑龙 孙圆明 刘帅康 《计算机工程与设计》 北大核心 2025年第4期1190-1197,共8页
针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型(ANER-IPAL)。基于自建的古籍文本数据集,使用NEZHA-TCN模型进行预训练,在嵌入... 针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型(ANER-IPAL)。基于自建的古籍文本数据集,使用NEZHA-TCN模型进行预训练,在嵌入层融合对抗学习增强模型泛化能力,在解码层引入全局指针网络,将实体识别任务建模为子串提取任务,结合规则进行结果的矫正输出。实验结果表明,所提模型在“古籍命名实体识别2023”数据集(GuNER2023)上的F1值达到了95.34%,相较于基线模型NEZHA-GP提高了4.19%。 展开更多
关键词 二十四史 古籍命名实体识别 增量预训练 时序卷积神经网络 对抗学习 全局指针 子串提取
在线阅读 下载PDF
基于MacBERT与全局指针网络的中文电子病历命名实体识别
6
作者 吴天宇 郭冬冬 +2 位作者 李文桥 李子康 苗琳 《科学技术与工程》 北大核心 2025年第11期4656-4665,共10页
针对现有序列标注方法不能有效解决中文电子病历嵌套实体识别问题,提出一种基于MacBERT与全局指针网络的中文电子病历命名实体识别模型。首先通过MacBERT-large预训练模型将文本转换为结合语境信息的动态向量,然后使用FGM (fast gradien... 针对现有序列标注方法不能有效解决中文电子病历嵌套实体识别问题,提出一种基于MacBERT与全局指针网络的中文电子病历命名实体识别模型。首先通过MacBERT-large预训练模型将文本转换为结合语境信息的动态向量,然后使用FGM (fast gradient method)方法生成对抗样本添加至原有向量并一同输入BiLSTM (bi-directional long short-term memory)网络获取上下文特征,并通过引入注意力机制增强长距离语义特征获取,最后利用全局指针网络模型同时考虑头部和尾部的特征信息进行解码以获得更好的医学嵌套实体预测效果。实验结果表明,本文模型相较于识别效果较好的主流模型全局指针网络模型在CCKS2019以及两个版本的CMeEE中文电子病历数据集上F1分别提高了1.8%、1.37%、1.72%,证明了模型的有效性。 展开更多
关键词 命名实体识别 中文电子病历 全局指针网络 注意力机制
在线阅读 下载PDF
融合RoBERTa-WWM和全局指针网络的农业病害实体关系联合抽取研究 被引量:4
7
作者 王彤 张立杰 +4 位作者 王铭 吴华瑞 朱华吉 杨英茹 王春山 《河北农业大学学报》 CAS CSCD 北大核心 2024年第3期113-120,129,共9页
针对实体和关系抽取过程中存在的一词多义、实体嵌套、三元组重叠的问题,本文提出了1种融合RoBERTa-WWM和全局指针网络的联合抽取模型RBGPL。该模型引入RoBERTa-WWM预训练模型,利用上下文的语境信息融合克服了不同语境下一词多义问题;... 针对实体和关系抽取过程中存在的一词多义、实体嵌套、三元组重叠的问题,本文提出了1种融合RoBERTa-WWM和全局指针网络的联合抽取模型RBGPL。该模型引入RoBERTa-WWM预训练模型,利用上下文的语境信息融合克服了不同语境下一词多义问题;采用全局指针网络Global pointer标注方式解决了实体嵌套问题;通过全局指针联合解码模型将三重抽取转变为五重提取,解决了三元组重叠问题。在自建农业病害数据集上,模型RBGPL的精确率、召回率、F1值达到76.23%,91.18%,83.04%,与其他联合抽取模型相对比F1值均取最优,有效地克服了一词多义问题和三元组重叠问题。此外,在病原(Pathogeny)和作物名称(Crop)2种易嵌套实体的F1值上提升了3%和18%,实体嵌套得到了显著缓解。本文方法提高了中文农业病害领域实体关系抽取性能,可为农业病害领域知识图谱的构建提供技术支持。 展开更多
关键词 农业病害 联合抽取 RoBERTa-WWM global pointer
在线阅读 下载PDF
基于对比学习与梯度惩罚的实体关系联合抽取模型 被引量:2
8
作者 张强 曾俊玮 陈锐 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1155-1162,共8页
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池... 针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取. 展开更多
关键词 实体关系抽取 对比学习 梯度惩罚 RoBERTa预训练模型 全局指针网络
在线阅读 下载PDF
一种面向法律文书的命名实体识别模型
9
作者 卢睿 李林瑛 《信息网络安全》 CSCD 北大核心 2024年第11期1783-1792,共10页
准确识别法律文书中的实体是构建智慧司法的基础,但通用的命名实体识别模型不能很好地识别法律文书中实体边界,识别结果不能与法律业务紧密结合。为有效提高法律文书中各实体的识别效果,文章提出一种面向法律文书的命名实体识别模型BBAG... 准确识别法律文书中的实体是构建智慧司法的基础,但通用的命名实体识别模型不能很好地识别法律文书中实体边界,识别结果不能与法律业务紧密结合。为有效提高法律文书中各实体的识别效果,文章提出一种面向法律文书的命名实体识别模型BBAG-NER。该模型首先利用BERT对字符序列进行编码,然后运用双向长短记忆神经网络和Attention分配不同权重以提高对实体边界的划分能力,最后采用全局指针识别备选司法实体片段,并通过实体分类器得到最终的实体类别。实验结果表明,在法律文书语料数据集上,BBAG-NER模型的F1值达到了89.18%,较BERT-CRF模型提高了2.1%,验证了模型整体的有效性。 展开更多
关键词 法律文书 命名实体识别 全局指针网络 双向长短时记忆
在线阅读 下载PDF
有限元法中总刚动态存取及其应用 被引量:1
10
作者 李树忱 程玉民 李术才 《岩土力学》 EI CAS CSCD 北大核心 2004年第4期646-650,共5页
讨论了如何利用FORTRAN 90中指针和派生类型相结合构成的链表结构的方法对总刚实现动态存取、增强总刚的灵活性,从而克服了以往总刚形成和存储的一些缺点。方法不仅能方便地实现总刚矩阵内任意位置上数据的插入和删除而不影响其它数组... 讨论了如何利用FORTRAN 90中指针和派生类型相结合构成的链表结构的方法对总刚实现动态存取、增强总刚的灵活性,从而克服了以往总刚形成和存储的一些缺点。方法不仅能方便地实现总刚矩阵内任意位置上数据的插入和删除而不影响其它数组结构的变化,而且比一般半带宽存储节约更多内存。方法特别适合岩土工程开挖与支护等大型结构的三维有限元分析,能大大提高求解效率。 展开更多
关键词 指针 链表 有限元法 总刚 动态存取
在线阅读 下载PDF
BGPNRE:一种基于BERT的全局指针网络实体关系联合抽取方法 被引量:8
11
作者 邓亮 齐攀虎 +2 位作者 刘振龙 李敬鑫 唐积强 《计算机科学》 CSCD 北大核心 2023年第3期42-48,共7页
实体-关系联合抽取指从非结构化文本中联合抽取出实体-关系三元组,是信息抽取和知识图谱构建的一项关键任务。文中提出了一种新的基于全局指针网络实体关系联合抽取方法BGPNRE(BERT-based Global Pointer Network for Named Entity-Rela... 实体-关系联合抽取指从非结构化文本中联合抽取出实体-关系三元组,是信息抽取和知识图谱构建的一项关键任务。文中提出了一种新的基于全局指针网络实体关系联合抽取方法BGPNRE(BERT-based Global Pointer Network for Named Entity-Relation Joint Extraction),首先通过潜在关系预测模块预测文本中蕴含的关系,过滤掉不可能存在的关系,将实体抽取限制在预测的关系子集中;其次通过使用基于关系的全局指针网络,获取所有主客体实体的位置;最后通过全局指针网络通信模块,将主客体位置高效率地解码对齐成一个实体关系三元组。该方法避免了传统管道式方法存在的错误传播问题,同时也解决了关系冗余、实体重叠、Span提取泛化不足等问题。实验结果表明,所提方法在多关系和重叠实体抽取上表现卓越,并且在NYT和WebNLG公共数据集上达到了最先进的水平。 展开更多
关键词 实体-关系联合抽取 BGPNRE 全局指针网络 BERT
在线阅读 下载PDF
基于单参数同态滤波与全局对比度增强的指针仪表读数识别方法 被引量:15
12
作者 胡秀军 于凤芹 《仪表技术与传感器》 CSCD 北大核心 2021年第5期42-46,51,共6页
为解决光照变化、指针阴影对指针式仪表读数识别的影响,提出具有单参数的指数型同态滤波与全局对比度处理的仪表读数识别方法。设计了单参数指数型同态滤波器来增强图像对光照变化的适应性;利用全局对比度图像增强算法来突出表盘信息区... 为解决光照变化、指针阴影对指针式仪表读数识别的影响,提出具有单参数的指数型同态滤波与全局对比度处理的仪表读数识别方法。设计了单参数指数型同态滤波器来增强图像对光照变化的适应性;利用全局对比度图像增强算法来突出表盘信息区域;通过二值化、连通域处理、形态学处理提取指针区域;通过细化处理和累计概率霍夫变换定位指针中心线;获取指针的偏转角度来计算仪表读数。仿真实验表明,所提算法能够在不同光照变化和存在指针阴影的条件下较好地提取指针区域,且读数识别的正确率达到95%以上。 展开更多
关键词 指针式仪表 光照变化 指针阴影 单参数指数型同态滤波 全局对比度 指针区域提取
在线阅读 下载PDF
IA64二进制翻译中的数据段映射技术
13
作者 张天雷 赵荣彩 +1 位作者 苏铭 付文 《计算机工程与应用》 CSCD 北大核心 2006年第9期26-29,共4页
数据段映射是二进制翻译过程中源可执行文件和目标可执行文件数据关系的纽带。论文介绍了32位处理器二进制翻译的数据段映射技术,指出了这种映射技术在IA64二进制翻译中存在的缺陷,进而提出了改进方法,并解决了IA64二进制翻译的数据段... 数据段映射是二进制翻译过程中源可执行文件和目标可执行文件数据关系的纽带。论文介绍了32位处理器二进制翻译的数据段映射技术,指出了这种映射技术在IA64二进制翻译中存在的缺陷,进而提出了改进方法,并解决了IA64二进制翻译的数据段映射问题。 展开更多
关键词 IA64二进制翻译 数据段映射 连接器脚本文件 全局数据指针
在线阅读 下载PDF
用于目标级情感分析的全局指针模型
14
作者 董慧洁 杨林楠 +1 位作者 陈健 费凡 《计算机工程与设计》 北大核心 2023年第12期3754-3760,共7页
针对现有研究中目标级情感分析中文数据集短缺的问题,构建一个目标级情感分析中文评论数据集,提出一种基于依赖关系注意力的全局指针模型DA-GP(dependency-based attention-global pointer)。以具有丰富语义的字词结合特征作为嵌入特征... 针对现有研究中目标级情感分析中文数据集短缺的问题,构建一个目标级情感分析中文评论数据集,提出一种基于依赖关系注意力的全局指针模型DA-GP(dependency-based attention-global pointer)。以具有丰富语义的字词结合特征作为嵌入特征,使用全局指针整体解决多目标抽取及分类,通过依赖关系注意力网络进一步增强模型的目标识别能力,使模型具有良好的泛化能力。在中文评论数据集上进行对比实验及自身消融实验,实验结果表明,DA-GP模型优于其它模型且可行有效。 展开更多
关键词 目标抽取 情感分析 全局指针 依赖关系注意力 字词嵌入 深度学习 标注方式
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部