期刊文献+
共找到182篇文章
< 1 2 10 >
每页显示 20 50 100
基于提示和度量学习的小样本地质关系抽取
1
作者 张志庭 彭帅 +1 位作者 阙翔 陈麒玉 《地学前缘》 北大核心 2025年第4期250-261,共12页
地质领域研究正经历以构建新知识体系为核心、大数据为驱动的深刻变革。地质知识图谱的构建能够有效地解决在数据分散状态下的知识发现与推理受限等问题。关系抽取技术作为知识图谱构建的关键技术之一,在地质实体关系识别中发挥关键作... 地质领域研究正经历以构建新知识体系为核心、大数据为驱动的深刻变革。地质知识图谱的构建能够有效地解决在数据分散状态下的知识发现与推理受限等问题。关系抽取技术作为知识图谱构建的关键技术之一,在地质实体关系识别中发挥关键作用。传统关系抽取技术高度依赖大规模标注数据。然而地质领域中实体关系复杂且专业性强,人工标注数据耗时费力,致使大规模标注数据短缺。因此,传统关系抽取技术在地质领域的有效应用受限。针对上述困境,本研究提出基于原型网络的地质关系抽取小样本学习方法,创新性地引入增强提示学习机制,并通过对比学习优化实例表示和关系描述表示,显著地提升了原型代表性。同时,采用加权损失函数和困难任务辅助训练策略,增强模型对困难任务的关注度,有效地提高了整体准确率。实验结果表明,本文提出的模型在地质小样本关系抽取数据集的5way 1-shot场景下准确率达到82.16%,相比通用领域先进模型SimpleFSRE提升1.94%,相比原型网络Proto-BERT方法提升9.01%,验证了所提方法的有效性。 展开更多
关键词 小样本学习 关系抽取 地质知识图谱 原型网络 提示学习
在线阅读 下载PDF
GHPN:面向半监督小样本节点分类的图超球面原型网络 被引量:1
2
作者 徐祖豪 陈鑫龙 +2 位作者 李进 黄益颂 傅仰耿 《小型微型计算机系统》 北大核心 2025年第3期542-551,共10页
图神经网络已经成功应用于各种与图相关的任务中.以有监督的方式训练一个图神经网络需要大量标签,而现实世界中受到成本制约难以获取大量标签,因此在小样本学习或半监督学习场景的标签就更为稀少.为了克服这个问题,许多方法通过标签传... 图神经网络已经成功应用于各种与图相关的任务中.以有监督的方式训练一个图神经网络需要大量标签,而现实世界中受到成本制约难以获取大量标签,因此在小样本学习或半监督学习场景的标签就更为稀少.为了克服这个问题,许多方法通过标签传播的方法来估计标签,但通常会受到图上连接性和同质性假设的限制,容易生成带有噪声的伪标签.为了解决这些限制,本文提出了一个名为图超球面原型网络的新方法GHPN,专注于半监督小样本节点分类.为了减轻图结构对预测结果的影响,GHPN在超球面表示空间中建模类别表示,通过类级别表示在语义空间中传播标签信息.此外,为了利用未标记节点的监督信息,本文设计了一个基于原型网络预测结果的负学习框架,用于补充监督信号,调整各类别原型之间的距离.在5个真实世界的数据集上进行的实验表明,该方法与10个最先进的方法相比能够有效提高性能,在4个数据集上能取得平均排名最佳结果. 展开更多
关键词 半监督学习 图表示学习 小样本学习 原型网络 负学习
在线阅读 下载PDF
基于自适应原型特征类矫正的小样本学习方法
3
作者 赵红 钟杨清 +1 位作者 金杰 邹林华 《自动化学报》 北大核心 2025年第2期475-484,共10页
针对小样本学习过程中样本数量不足导致的性能下降问题,基于原型网络(Prototype network,ProtoNet)的小样本学习方法通过实现查询样本与支持样本原型特征间的距离度量,从而达到很好的分类性能.然而,这种方法直接将支持集样本均值视为类... 针对小样本学习过程中样本数量不足导致的性能下降问题,基于原型网络(Prototype network,ProtoNet)的小样本学习方法通过实现查询样本与支持样本原型特征间的距离度量,从而达到很好的分类性能.然而,这种方法直接将支持集样本均值视为类原型,在一定程度上加剧了对样本数量稀少情况下的敏感性.针对此问题,提出了基于自适应原型特征类矫正的小样本学习方法(Few-shot learning based on class rectification via adaptive prototype features,CRAPF),通过自适应生成原型特征来缓解方法对数据细微变化的过度响应,并同步实现类边界的精细化调整.首先,使用卷积神经网络构建自适应原型特征生成模块,该模块采用非线性映射获取更为稳健的原型特征,有助于减弱异常值对原型构建的影响;然后,通过对原型生成过程的优化,提升不同类间原型表示的区分度,进而强化原型特征对类别表征的整体效能;最后,在3个广泛使用的基准数据集上的实验结果显示,该方法提升了小样本学习任务的表现. 展开更多
关键词 小样本学习 原型网络 原型特征 类矫正
在线阅读 下载PDF
融合情绪标签和原型网络的对话情绪识别
4
作者 张洪通 王健 +2 位作者 徐博 杨亮 林鸿飞 《大连理工大学学报》 北大核心 2025年第3期313-320,共8页
对话情绪识别的目标是识别对话中话语的情绪,尽管已经有一些先进的监督对比学习方法被提出用于区分不同的情绪类别,但情绪标签中的内在信息仍未得到充分利用.情绪标签包含特定的语义和复杂的相互关系,可以被用作对比学习的样本,以提高... 对话情绪识别的目标是识别对话中话语的情绪,尽管已经有一些先进的监督对比学习方法被提出用于区分不同的情绪类别,但情绪标签中的内在信息仍未得到充分利用.情绪标签包含特定的语义和复杂的相互关系,可以被用作对比学习的样本,以提高情绪识别的效果.提出了一种标签引导的原型对比学习方法用于对话情绪识别,该方法设计了一个对比目标,其中情绪标签被视为正负样本,构建的标签嵌入参与了对比训练过程,有效地丰富了对比样本.此外,该方法利用原型网络关注数据的整体分布和平均特性.在3个广泛使用的基准数据集上的实验表明,所提方法在对话情绪识别上的性能超越了现有方法. 展开更多
关键词 情绪识别 对比学习 标签信息 原型网络
在线阅读 下载PDF
面向垂直领域上下文特性的少样本关系抽取方法
5
作者 任浩 李韧 +4 位作者 杨建喜 肖桥 杨小霞 蒋仕新 王笛 《中文信息学报》 北大核心 2025年第1期65-78,共14页
现有的少样本关系抽取解决方案主要基于通用领域语料,尚未充分考虑垂直领域中存在的长文本、关系重叠等问题,面对垂直领域上下文时其关系抽取性能有待提升。针对上述问题,该文以桥梁检测领域和医疗健康领域为背景,提出了一种面向垂直领... 现有的少样本关系抽取解决方案主要基于通用领域语料,尚未充分考虑垂直领域中存在的长文本、关系重叠等问题,面对垂直领域上下文时其关系抽取性能有待提升。针对上述问题,该文以桥梁检测领域和医疗健康领域为背景,提出了一种面向垂直领域上下文特性的少样本关系抽取方法。该方法首先通过预训练语言模型RoBERTa_chinese_base对文本进行编码,再分别在双向长短时记忆网络(BiLSTM)和实体特征提取模块中进一步提取上下文特征和实体级特征,并在特征融合的基础上,通过原型网络进行关系预测。实验结果显示,该文方法在自建的桥梁检测领域数据集Bridge-FewRel上评测结果优于对比的基线模型。在中文医疗健康领域数据集TinyRel-CM的少样本关系抽取任务上,该文方法的大部分结果优于基线模型。同时,该文方法在公有领域数据集FewRel 1.0的5-way-5-shot和10-way-5-shot任务上也取得了有竞争力的结果。 展开更多
关键词 少样本关系抽取 垂直领域 RoBERTa 原型网络
在线阅读 下载PDF
大模型使能的语义通信研究现状与发展趋势
6
作者 刘方彧 丁家润 +3 位作者 冯禹硕 姜培文 李潇 金石 《信号处理》 北大核心 2025年第6期993-1014,共22页
随着通信技术和新兴场景的快速发展,未来无线通信网络将面临更加复杂的需求,如全覆盖、高速率、高可靠以及智能化的泛在连接。同时,数据流量和带宽需求的激增也对新场景的通信网络提出了更高的挑战。语义通信作为一项前沿技术,通过神经... 随着通信技术和新兴场景的快速发展,未来无线通信网络将面临更加复杂的需求,如全覆盖、高速率、高可靠以及智能化的泛在连接。同时,数据流量和带宽需求的激增也对新场景的通信网络提出了更高的挑战。语义通信作为一项前沿技术,通过神经网络提取和传输数据的语义信息,显著降低带宽需求并提升传输质量。近期兴起的大模型凭借强大的特征提取和理解能力,在表达能力和预测性能上具有显著优势,能够有效处理多模态信息和复杂数据,相比于传统网络,展现出更广泛的应用潜力。在此背景下,本文综述了大模型赋能的语义通信的研究现状与发展趋势,重点探讨了其在语义编解码、物理层、网络层的设计及实际部署中的应用。首先,介绍了语义通信的基本概念,分析其基本结构及其与传统通信方案的区别,并简述了基于大模型的语义通信相关技术。接着,从语义编解码、物理层设计和网络层三个角度,分析了大模型与传统神经网络在语义通信中的性能表现,展示大模型在提升通信准确性、效率和鲁棒性方面的潜力。最后,本文总结了通信大模型的未来发展方向及面临的挑战,包括模型的训练、定制化、原型验证等问题,并展望了解决训练数据获取与同步、计算资源与硬件功耗等问题的新思路,以推动大模型在语义通信中的进一步应用与发展。 展开更多
关键词 语义通信 大模型 物理层 网络层 原型验证
在线阅读 下载PDF
开放生成与特征优化的开集识别方法
7
作者 向尔康 黄荣 董爱华 《计算机应用》 北大核心 2025年第7期2195-2202,共8页
当深度神经网络(DNN)遇到训练时未遇见的类别的样本时,不能准确地拒绝未知类样本,而开集识别能在准确分类已知类样本同时拒绝未知类样本。目前在开集识别领域,原型学习方法广为应用,然而这些方法都无法同时保证样本分布内的紧凑性和样... 当深度神经网络(DNN)遇到训练时未遇见的类别的样本时,不能准确地拒绝未知类样本,而开集识别能在准确分类已知类样本同时拒绝未知类样本。目前在开集识别领域,原型学习方法广为应用,然而这些方法都无法同时保证样本分布内的紧凑性和样本分布间的分离性。因此,提出开放生成与特征优化的开集识别方法(OGFO)。首先,提出开放点的概念,原型点通过DNN学习对应类别样本的固有特征而开放点是各类别原型点的均值。开放点代表未知类的固有特征且占据特征空间的中心区域。特征空间中心区域为未知类样本分布的开放空间;其次,提出基于开放点的特征优化算法(FOA),从而利用开放点强迫相同类别样本内部的分布更加紧凑并且迫使不同类别样本间的分布更加分离;最后,提出基于开放点的生成方法 OGAN(Open Generative Adversarial Network),并使用DNN迫使OGAN生成的未知类样本分布在开放点占据的开放空间中。实验结果表明,相较于基于对抗性反向点学习的开集识别方法(ARPL),OGFO在MNIST、SVHN、CIFAR10和TinyImageNet数据集上的AUROC(Area Under the Receiver Operating Characteristic curve)提升明显,尤其在TinyImageNet数据集上的AUROC上至少提升了3个百分点,在准确率和OSCR(Open Set Classification Rate)上分别至少提升6和5个百分点。可见,OGFO解决了其他方法无法兼顾样本分布内的紧凑性和样本分布间的分离性的问题。 展开更多
关键词 特征优化 开集识别 开放点 原型学习 深度神经网络 生成器
在线阅读 下载PDF
基于原型网络的风电拉挤玻板质量异常识别
8
作者 张璇 韩宇 +1 位作者 杨晓英 石岩 《组合机床与自动化加工技术》 北大核心 2025年第1期218-222,共5页
为了实现风电拉挤玻板生产过程可靠的质量异常识别,针对风电拉挤玻板生产过程中样本量少的问题,提出了一种融合了数据增强技术和原型网络的质量异常识别方法。首先,使用了Mixup数据增强方法,通过线性插值的方式增加样本数量,减少模型的... 为了实现风电拉挤玻板生产过程可靠的质量异常识别,针对风电拉挤玻板生产过程中样本量少的问题,提出了一种融合了数据增强技术和原型网络的质量异常识别方法。首先,使用了Mixup数据增强方法,通过线性插值的方式增加样本数量,减少模型的过拟合现象;同时,结合不需要大量的数据来学习复杂特征表示的原型网络,建立异常识别模型,解决风电拉挤玻板质量异常识别中存在的小样本问题;最后,在某公司的仿真实验中,与SVM、LSSVM和MLP方法进行比较,结果表明此方法在小样本条件下显著提高了风电拉挤玻板过程质量异常识别准确率,实现了可靠的质量异常识别。 展开更多
关键词 风电拉挤玻板 Mixup 原型网络 质量异常识别
在线阅读 下载PDF
小样本下MTF和CBAM-IGPN的柴油机气门故障诊断
9
作者 王立佳 黄国勇 《机械科学与技术》 北大核心 2025年第7期1143-1150,共8页
针对柴油机气门早期故障特征不明显以及故障样本数量不足导致故障诊断识别精度低的问题,提出在小样本下基于马尔可夫变迁场(Markov transition field,MTF)和融合卷积注意力机制模块并改进嵌入网络的高斯原型网络(Convolutional block at... 针对柴油机气门早期故障特征不明显以及故障样本数量不足导致故障诊断识别精度低的问题,提出在小样本下基于马尔可夫变迁场(Markov transition field,MTF)和融合卷积注意力机制模块并改进嵌入网络的高斯原型网络(Convolutional block attention module-improved gaussian prototype network,CBAM-IGPN)的柴油机气门间隙故障诊断研究。首先,根据柴油机缸盖振动信号特性,将缸盖的一维振动信号通过MTF编码成二维特征图。其次,通过改进GPN中的嵌入网络,将初始嵌入网络(Convolutional neural networks,CNN)进行改进为深度卷积神经网络(Deep convolutional neural networks,DCNN)提高模型对特征图深层信息的挖掘,在DCNN的卷积层中加入CBAM增强模型对重要区域的注意力。最后,将编码后的特征图输入到CBAM-IGPN中训练并进行测试得到分类结果。结果表明,该文所提方法在小样本条件下对柴油机气门故障诊断精度更高。 展开更多
关键词 柴油机 故障诊断 马尔可夫变迁场 高斯原型网络 小样本
在线阅读 下载PDF
小样本条件下的通信辐射源个体识别方法
10
作者 牛雅萌 崔良中 孙佳杰 《兵器装备工程学报》 北大核心 2025年第4期278-284,共7页
针对通信辐射源个体信号采集困难,可训练样本量少造成的通信辐射源个体识别准确率低的问题,提出了一种小样本条件下的通信辐射源个体识别方法。该方法使用MLSTM-FCN模型提取个体信号的指纹特征,并采用元学习策略对原型网络对进行训练学... 针对通信辐射源个体信号采集困难,可训练样本量少造成的通信辐射源个体识别准确率低的问题,提出了一种小样本条件下的通信辐射源个体识别方法。该方法使用MLSTM-FCN模型提取个体信号的指纹特征,并采用元学习策略对原型网络对进行训练学习,使得特征间的原型分布更为明显。实验结果表明,提出的小样本条件下的通信辐射源个体识别方法相较于其他识别方法识别效果更佳,在信噪比[10 dB,20 dB]情况下的平均识别准确率超过80%。 展开更多
关键词 小样本 原型网络 元学习 通信辐射源 个体识别
在线阅读 下载PDF
基于知识增强自适应原型网络的小样本关系分类
11
作者 张河萍 方志军 +1 位作者 卢俊鑫 高永彬 《计算机工程》 北大核心 2025年第4期129-136,共8页
小样本关系分类(FSRC)是指在任务中使用少量标注实例对各种关系进行分类,可快速适用于对全新的类别进行归类。然而,当测试域与训练域之间存在分布差异时,现有的小样本分类算法泛化能力有限,导致分类性能下降。针对该问题,提出一种适用... 小样本关系分类(FSRC)是指在任务中使用少量标注实例对各种关系进行分类,可快速适用于对全新的类别进行归类。然而,当测试域与训练域之间存在分布差异时,现有的小样本分类算法泛化能力有限,导致分类性能下降。针对该问题,提出一种适用于领域适应任务的知识增强自适应原型网络。通过探索实例之间的联系以提高模型的鲁棒性,同时学习关于关系的先验知识和内在语义以获得可解释原型。通过引入交互注意力机制来捕捉支持实例与查询实例之间的相关性,突出关键实例,并生成交互实例。同时,自适应原型融合机制以关系信息为锚点生成自适应混合系数,通过特征融合将实例与关系信息相结合,从而生成混合原型。在公开数据集FewRel 1.0和FewRel 2.0上的实验结果验证了该网络的有效性。实验结果表明,与基线模型相比,所提网络模型的分类准确率取得了显著提升,具有更好的分类效果与稳定性。 展开更多
关键词 关系分类 小样本学习 小样本关系分类 原型网络 知识增强
在线阅读 下载PDF
基于UHPLC-Q-Exactive Orbitrap MS和分子网络技术研究补肾活血方在大鼠体内的吸收原型和代谢产物
12
作者 王宇 匡微 +2 位作者 黄宇霞 谢孟君 张梅 《中华中医药学刊》 北大核心 2025年第2期127-136,I0029-I0030,共12页
目的补肾活血方由地黄、丹参、人参及葛根组成,目前已证实对糖尿病性视网膜病变有良好的临床疗效。该研究旨在分析此方在大鼠体内的吸收原型和代谢产物,以及这些成分在大鼠体内的分布差异。方法SD大鼠灌胃补肾活血方后,收集不同时间点... 目的补肾活血方由地黄、丹参、人参及葛根组成,目前已证实对糖尿病性视网膜病变有良好的临床疗效。该研究旨在分析此方在大鼠体内的吸收原型和代谢产物,以及这些成分在大鼠体内的分布差异。方法SD大鼠灌胃补肾活血方后,收集不同时间点的大鼠血浆、肝、心、脾、肺、肾、肠、胃、眼、尿液及粪便,采用超高效液相色谱-四极杆-静电场轨道阱高分辨质谱(UHPLC-Q-Exactive Orbitrap MS)采集数据,通过数据库匹配及比对相关文献中的相对分子质量、离子碎片等信息鉴定成分,并结合分子网络技术补充代谢产物。结果在大鼠体内共鉴定到75个吸收原型及123个代谢成分,包括苯乙醇苷类、丹参酮类、人参皂苷类、异黄酮类、环烯醚萜类、丹酚酸类等,主要集中于肝和肾中。苯乙醇苷类成分来源于地黄,其生物利用率低,易经过生物转化形成甲基化、葡萄糖醛酸化等代谢物,更多分布于肾中;丹参酮类及异黄酮类原型成分分别来源于丹参和葛根,在大鼠血浆和各组织中易被检测到,其代谢途径以羟基化、甲基化及葡萄糖醛酸化为主,产物易分布于血浆及肝肾组织中。人参皂苷类化合物在大鼠体内易被胃肠道水解为原人参二醇及原人参三醇,经脱氢、脱氧等I相代谢后,产物更多分布于脾。结论该研究初步阐明了补肾活血方原型成分及代谢产物的吸收、分布情况,为阐释补肾活血方及地黄、丹参、人参及葛根治疗糖尿病性视网膜病变的药效物质基础提供了科学依据。 展开更多
关键词 补肾活血方 吸收原型 代谢产物 组织分布 分子网络技术 超高效液相色谱-四极杆-静电场轨道阱高分辨质谱
在线阅读 下载PDF
结合通道与空间注意力机制的声音事件检测方法
13
作者 冯宇轩 刘玲文 +1 位作者 付海涛 朱丽 《吉林大学学报(理学版)》 北大核心 2025年第4期1143-1149,共7页
针对样本稀缺条件下声学特征提取不充分的问题,提出一种基于通道和空间压缩的小样本声音事件检测方法.该方法通过构建双压缩注意力机制,在通道维度进行特征筛选,在空间维度实现特征聚焦,有效提升了原型网络在小样本场景下的特征判别能力... 针对样本稀缺条件下声学特征提取不充分的问题,提出一种基于通道和空间压缩的小样本声音事件检测方法.该方法通过构建双压缩注意力机制,在通道维度进行特征筛选,在空间维度实现特征聚焦,有效提升了原型网络在小样本场景下的特征判别能力.实验结果表明,该方法在数据集DCASE(detection and classification of acoustic scenes and events)上的F1达66.84%,相比原型网络方法提升4.11个百分点,为野生动物监测和生态环境评估等实际应用提供了更可靠的技术支持. 展开更多
关键词 声音事件检测 原型网络 通道注意力 空间注意力
在线阅读 下载PDF
少样本场景下的气液两相流动状态识别
14
作者 李凌涵 张淑美 董峰 《化工进展》 北大核心 2025年第4期1794-1805,共12页
气液两相流具有复杂多变的流动状态,包括典型状态和过渡状态。流动状态的准确识别与监测对深入理解两相流机理和保证工业过程的安全运行至关重要。然而,传感器部署成本的限制和实际流动过程数据采集的难度导致了气液两相流的数据欠缺。... 气液两相流具有复杂多变的流动状态,包括典型状态和过渡状态。流动状态的准确识别与监测对深入理解两相流机理和保证工业过程的安全运行至关重要。然而,传感器部署成本的限制和实际流动过程数据采集的难度导致了气液两相流的数据欠缺。本文系统地讨论了气液两相流的少样本流动状态识别问题,采用电导传感器信息处理、多尺度域时频特性分析、原型网络小样本元学习框架。首先,利用响应快、安全、成本低的电导传感器进行测量,获取反映气液两相流动态特性和流动结构的含水率信息。然后,对电导传感器的响应信号进行时频分析,通过改进的经验小波变换法获得电导信号在多尺度域的波动信息,实现不同流动状态的联合表征。最后,将所提取特征嵌入原型网络中,在元学习框架下进行模型训练,解决少样本场景下的气液两相流动状态识别问题。利用6种典型流动状态和4种过渡状态进行了少样本状态识别实验,在目标流动状态只采用3个或5个样本进行训练的情况下,平均识别准确率超过80%,验证了方法的有效性。 展开更多
关键词 气液两相流 仪器仪表 神经网络 状态识别 少样本学习 原型网络
在线阅读 下载PDF
面向lncRNA亚细胞定位预测的注意力BiLSTM与原型网络
15
作者 孙荣能 刘琳 亢元召 《计算机工程》 北大核心 2025年第8期168-180,共13页
长链非编码RNA(lncRNA)在细胞的许多生命过程中发挥着重要作用,而lncRNA亚细胞定位可为其功能识别带来关键信息。通过传统生物生化实验方法鉴定lncRNA亚细胞定位时存在程序复杂、难以复制、成本高等缺点,为此,提出一种面向lncRNA亚细胞... 长链非编码RNA(lncRNA)在细胞的许多生命过程中发挥着重要作用,而lncRNA亚细胞定位可为其功能识别带来关键信息。通过传统生物生化实验方法鉴定lncRNA亚细胞定位时存在程序复杂、难以复制、成本高等缺点,为此,提出一种面向lncRNA亚细胞定位预测的注意力双向长短时记忆(BiLSTM)与原型网络方法BP-lncLoc。首先,基于原始序列数据获取K-mer初始特征,并对其进行平衡处理;其次,结合注意力BiLSTM有效提取lncRNA序列的深层隐含特征,并优化神经网络在处理高维数据时可能出现的梯度消失问题;随后,针对lncRNA亚细胞定位数据的小样本特性,构建不依赖大规模训练样本的原型网络预测框架;最后,从量化输入特征对输出决策重要性的角度出发,实现预测模型的可解释性。实验结果表明,该方法在公开数据集上的准确率达到了98.89%,优于对比方法,为lncRNA亚细胞定位预测的应用提供了一种新思路。 展开更多
关键词 lncRNA亚细胞定位 不平衡学习 双向长短时记忆网络 原型网络 可解释
在线阅读 下载PDF
基于分解式模糊跨度的小样本命名实体识别
16
作者 曾碧卿 钟广彬 温志庆 《计算机应用》 北大核心 2025年第5期1504-1510,共7页
小样本命名实体识别(few-shot NER)旨在基于少量标记数据识别文本中的实体跨度和类型。近年来,基于跨度的度量学习虽然取得了不错的效果,但仍然存在2个问题:一是少量的候选跨度可能导致原型偏离群组的中心;二是与类别无关的跨度检测器... 小样本命名实体识别(few-shot NER)旨在基于少量标记数据识别文本中的实体跨度和类型。近年来,基于跨度的度量学习虽然取得了不错的效果,但仍然存在2个问题:一是少量的候选跨度可能导致原型偏离群组的中心;二是与类别无关的跨度检测器可能会产生一些非实体跨度。为了解决以上问题,提出一种用于few-shot NER的融合模糊跨度的分解式模型DFSM(Decomposed Fuzzy Span Model)。在跨度检测阶段,为学习明确的实体边界信息且不受标记级别的标签依赖影响,DFSM采用全局边界矩阵检测候选跨度;而在跨度分类阶段,为增加可训练的每种实体类型的候选跨度数量,提出一种模糊跨度策略,以调整候选跨度的边界范围。同时,设计一种原型对比学习以优化基于跨度的语义表示空间。此外,为消除非实体噪声数据的干扰,引入原型边界学习以扩大非实体跨度与原型的距离。在Few-NERD和CrossNER数据集上的实验结果显示:与基线模型TadNER相比,在Few-NERD Inter设置中,DFSM的平均F1值提升了8.52个百分点,尤其是在Inter 10 way 5~10-shot设置中,DFSM的平均F1值提升了10.39个百分点,这表明DFSM对于细粒度实体类型具有更强的识别能力;与基线模型DecomMeta相比,在CrossNER 1-shot和5-shot设置中,DFSM的平均F1值分别提升了3.32和1.09个百分点,这表明DFSM在跨领域低资源场景下具有良好的泛化能力。 展开更多
关键词 命名实体识别 小样本学习 原型网络 全局边界矩阵 模糊跨度
在线阅读 下载PDF
基于细粒度原型网络的小样本命名实体识别方法 被引量:2
17
作者 戚荣志 周俊宇 +1 位作者 李水艳 毛莺池 《软件学报》 EI CSCD 北大核心 2024年第10期4751-4765,共15页
原型网络直接应用于小样本命名实体识别(few-shot named entity recognition,FEW-NER)时存在以下问题:非实体之间不具有较强的语义关系,对实体和非实体都采用相同的方式构造原型将会造成非实体原型不能准确表示非实体的语义特征;仅使用... 原型网络直接应用于小样本命名实体识别(few-shot named entity recognition,FEW-NER)时存在以下问题:非实体之间不具有较强的语义关系,对实体和非实体都采用相同的方式构造原型将会造成非实体原型不能准确表示非实体的语义特征;仅使用平均实体向量表示作为原型的计算方式将难以捕捉语义特征相差较大的同类实体.针对上述问题,提出基于细粒度原型网络的小样本命名实体识别(FEW-NER based on fine-grained prototypical networks,FNFP)方法,有助于提高小样本命名实体识别的标注效果.首先,为不同的查询集样本构造不同的非实体原型,捕捉句子中关键的非实体语义特征,得到更为细粒度的原型,提升模型对非实体的识别效果;然后,设计一个不一致性度量模块以衡量同类实体之间的不一致性,对实体与非实体采用不同的度量函数,从而减小同类样本之间的特征表示,提升原型的特征表示能力;最后,引入维特比解码器捕捉标签转换关系,优化最终的标注序列.实验结果表明,采用基于细粒度原型网络的小样本命名实体识别方法,在大规模小样本命名实体识别数据集FEW-NERD上,较基线方法获得提升;同时在跨领域数据集上验证所提方法在不同领域场景下的泛化能力. 展开更多
关键词 小样本命名实体识别 细粒度原型网络 小样本学习 特征表示
在线阅读 下载PDF
基于微调原型网络的小样本敏感信息识别方法 被引量:3
18
作者 余正涛 关昕 +2 位作者 黄于欣 张思琦 赵庆珏 《中文信息学报》 CSCD 北大核心 2024年第1期115-123,共9页
敏感信息识别主要是指识别互联网上涉及色情、毒品、邪教、暴力等类型的敏感信息,现有的敏感信息识别通常将其看作文本分类任务,但由于缺乏大规模的敏感信息标注数据,分类效果不佳。该文提出一种基于微调原型网络的小样本敏感信息识别方... 敏感信息识别主要是指识别互联网上涉及色情、毒品、邪教、暴力等类型的敏感信息,现有的敏感信息识别通常将其看作文本分类任务,但由于缺乏大规模的敏感信息标注数据,分类效果不佳。该文提出一种基于微调原型网络的小样本敏感信息识别方法,在小样本学习框架下,利用快速适应的微调原型网络来缓解元训练阶段通用新闻领域和元测试阶段敏感信息数据差异大的问题。首先,在元训练阶段,基于通用新闻领域的分类数据训练模型来学习通用知识,同时在训练过程中经过两阶段梯度更新,得到一组对新任务敏感的快速适应初始参数,然后在元测试阶段敏感文本数据集的新任务上,冻结模型部分参数并使用支持集进一步微调,使模型更好地泛化到敏感识别领域上。实验结果证明,相比当前最优的小样本分类模型,该文提出的快速适应微调策略的原型网络显著提升了敏感信息识别效果。 展开更多
关键词 敏感信息识别 小样本学习 微调策略 原型网络
在线阅读 下载PDF
基于CBAM和原型网络的小样本恶意软件分类模型 被引量:1
19
作者 周景贤 崔海彬 李志平 《计算机工程与设计》 北大核心 2024年第7期1941-1947,共7页
为解决小样本条件下恶意软件分类准确率低的问题,提出一种基于CBAM(convolutional block attention module)和原型网络的恶意软件分类模型。利用图像转换算法将恶意软件可执行文件转换为灰度图像;将残差连接和CBAM引入模型的特征嵌入模... 为解决小样本条件下恶意软件分类准确率低的问题,提出一种基于CBAM(convolutional block attention module)和原型网络的恶意软件分类模型。利用图像转换算法将恶意软件可执行文件转换为灰度图像;将残差连接和CBAM引入模型的特征嵌入模块,从通道和空间两个维度上增强关键特征表达,使得到的特征更具分辨性;提出联合损失函数,在距离交叉熵损失的基础上加入原型损失,通过减小类内距离的方式进一步扩增类间距离,使模型在样本数量有限的情况下取得良好的分类效果。实验结果表明,在每类恶意软件仅有5个样本的情况下,模型的分类准确率仍可达到83.12%。 展开更多
关键词 恶意软件分类 灰度图 小样本学习 卷积神经网络 注意力机制 原型网络 联合损失函数
在线阅读 下载PDF
基于元学习的植物虫害识别原型网络VGG-ML 被引量:1
20
作者 郭小燕 尚皓玺 《南京农业大学学报》 CAS CSCD 北大核心 2024年第2期392-401,共10页
[目的]为解决使用深度学习技术对植物虫害识别时依赖大量训练样本的问题,本文基于元学习的思想设计一个VGG原型网络(VGG-meta learning,VGG-ML),用于在小样本背景下植物虫害种类识别。[方法]采用VGG16作为嵌入单元提取虫害样本特征与类... [目的]为解决使用深度学习技术对植物虫害识别时依赖大量训练样本的问题,本文基于元学习的思想设计一个VGG原型网络(VGG-meta learning,VGG-ML),用于在小样本背景下植物虫害种类识别。[方法]采用VGG16作为嵌入单元提取虫害样本特征与类别特征,为提高网络对于新类别的识别能力,采用训练集与测试集异域方式进行模型训练,以解决在小样本情况下植物虫害识别准确率低、新类别虫害无法识别的问题。将测试集划分为支持集(获取类原型)与查询集(样本原型),以欧式距离度量样本原型与类原型之间的相似性,从而判定样本所属类别。[结果]以公开数据集IP102中玉米、甜菜、苜蓿等11种植物的蚜虫、黏虫、跳甲等24类农业虫害图片作为训练数据,以稻纵卷叶螟、稻叶毛虫、亚洲稻螟、稻瘿蚊、稻秆蝇、稻水象甲、稻叶蝉、稻苞虫8类常见的水稻虫害作为测试数据,在5-way、1-shot与5-way、5-shot情况下VGG-ML识别准确率分别为67.98%与81.5%,与原始原型网络相比提高3.53与4.4百分点。5-way、5-shot试验与基于迁移学习的ResNet50与VGG16网络对比,准确率分别提高28.65与25.94百分点。[结论]VGG-ML在进行小样本植物虫害类型识别时有效可靠,可适用于小样本植物识别问题。 展开更多
关键词 深度学习 原型网络 植物虫害 元学习
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部