期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
通过Grad-CAM++提升GIS局部放电深度诊断模型的泛化性评估精度
1
作者 闫泽玉 刘云鹏 +2 位作者 范晓舟 范澜珊 肖海 《中国电机工程学报》 北大核心 2025年第21期8622-8633,I0029,共13页
为提升现有局部放电深度诊断模型的泛化性评估精度和诊断结果的可解释性,该文提出样本特征提取效果和模型泛化能力的量化指标一一对焦系数及其复合指标。通过改进的梯度权重类激活映射图(improved gradient-weighted class activation m... 为提升现有局部放电深度诊断模型的泛化性评估精度和诊断结果的可解释性,该文提出样本特征提取效果和模型泛化能力的量化指标一一对焦系数及其复合指标。通过改进的梯度权重类激活映射图(improved gradient-weighted class activation mapping,Grad-CAM++)计算训练样本的类激活映射图(class activation mapping,CAM),并将其与局部放电相位分布(phase resolved partial discharge,PRPD)图卷积后除以调整因子,获得对焦系数。调整因子是将CAM按照局放次数进行最优分配后的卷积结果,是完美深度诊断模型的估计值。因此,对焦系数可以看作现有模型特征提取能力与理想模型的比值,其值大小在一定程度上能够表征模型的泛化能力。在此基础上,构建准确率与对焦系数的复合指标,进行最终模型的综合评估。通过110kV真型气体绝缘组合电器(gas insulated switchgear,GIS)平台收集7种多源缺陷局放数据,构建12个深度诊断模型。通过试验数据和现场数据构建6组测试数据集,验证该评估方法的有效性。结果表明,对焦系数能够有效量化CAM的可视化分析结果,提高诊断结果的置信度。综合对焦系数构建的复合指标(=10%)泛化相关性为81.01%,相较准确率指标提升8.74%。通过复合指标优选的诊断模型在现场陌生数据集下准确率为97%,相对传统优选方法准确率提升9.1%。 展开更多
关键词 局部放电 梯度加权类激活映射图 深度神经网络 可解释性 泛化性 气体绝缘组合电器
在线阅读 下载PDF
基于改进SDP和FasterNet-GCAM的滚动轴承故障诊断
2
作者 陈家芳 唐湛恒 周健 《现代制造工程》 北大核心 2025年第7期129-138,41,共11页
对滚动轴承进行故障诊断关乎设备运行安全及稳定可靠性。使用传统卷积神经网络进行故障诊断,模型运算量过大,且易出现过拟合现象从而导致诊断精度不高,端到端模型存在可信度不高等问题。鉴于此,提出一种基于改进对称极坐标(Symmetrized ... 对滚动轴承进行故障诊断关乎设备运行安全及稳定可靠性。使用传统卷积神经网络进行故障诊断,模型运算量过大,且易出现过拟合现象从而导致诊断精度不高,端到端模型存在可信度不高等问题。鉴于此,提出一种基于改进对称极坐标(Symmetrized Dot Pattern,SDP)法和FasterNet-GCAM网络的滚动轴承故障诊断方法。首先,将一维振动信号经过小波阈值降噪处理,再输入经皮尔逊图像相关系数法优化的SDP法生成SDP图像,并通过在FasterNet网络中加入部分卷积(partial convolution)思想,构建成改进的SDP-FasterNet模型进行进一步的特征提取,并完成滚动轴承不同故障的分类诊断。为了验证模型在图像识别过程中决策的可信度,将梯度加权类激活映射(Gradient-weighted Class Activation Mapping,Grad-CAM)与FasterNet网络相结合,突出SDP图像与决策相关的重要部分。试验结果表明,所提方法相比于其他方法具有更快的收敛速度和更强的鲁棒性,且诊断识别精度达到了99.20%,并提高了诊断过程中的可解释性及可信度,为故障诊断领域提供了具备良好可行性和鲁棒性的轻量化诊断模型。 展开更多
关键词 滚动轴承 故障诊断 FasterNet网络 部分卷积 梯度加权类激活映射 对称极坐标法
在线阅读 下载PDF
基于对抗补丁的可泛化的Grad-CAM攻击方法 被引量:4
3
作者 司念文 张文林 +3 位作者 屈丹 常禾雨 李盛祥 牛铜 《通信学报》 EI CSCD 北大核心 2021年第3期23-35,共13页
为了验证Grad-CAM解释方法的脆弱性,提出了一种基于对抗补丁的Grad-CAM攻击方法。通过在CNN分类损失函数后添加对Grad-CAM类激活图的约束项,可以针对性地优化出一个对抗补丁并合成对抗图像。该对抗图像可在分类结果保持不变的情况下,使G... 为了验证Grad-CAM解释方法的脆弱性,提出了一种基于对抗补丁的Grad-CAM攻击方法。通过在CNN分类损失函数后添加对Grad-CAM类激活图的约束项,可以针对性地优化出一个对抗补丁并合成对抗图像。该对抗图像可在分类结果保持不变的情况下,使Grad-CAM解释结果偏向补丁区域,实现对解释结果的攻击。同时,通过在数据集上的批次训练及增加扰动范数约束,提升了对抗补丁的泛化性和多场景可用性。在ILSVRC2012数据集上的实验结果表明,与现有方法相比,所提方法能够在保持模型分类精度的同时,更简单有效地攻击Grad-CAM解释结果。 展开更多
关键词 卷积神经网络 可解释性 对抗补丁 类激活图 显著图
在线阅读 下载PDF
基于深度学习算法联合Grad-CAM的宫腔镜子宫内膜病变诊断模型研究 被引量:4
4
作者 曹明亮 尹蜜 +9 位作者 王庆彬 朱汉峰 李星 张珺 毛林 穆雪峰 曹敏 马于涛 王健 张燕 《实用妇产科杂志》 CAS CSCD 北大核心 2024年第5期409-413,共5页
目的:探讨基于深度学习(DL)算法联合可视化技术梯度加权类激活热图(Grad-CAM)开发的宫腔镜子宫内膜病变诊断模型的有效性。方法:选择2021年6月1日至2022年12月31日在武汉大学人民医院妇科行宫腔镜检查的291例患者的303段宫腔镜视频(478... 目的:探讨基于深度学习(DL)算法联合可视化技术梯度加权类激活热图(Grad-CAM)开发的宫腔镜子宫内膜病变诊断模型的有效性。方法:选择2021年6月1日至2022年12月31日在武汉大学人民医院妇科行宫腔镜检查的291例患者的303段宫腔镜视频(4781张图像),采用权重采样的方法,将数据集划分为训练集(3703张)和测试集(1078张)。在对训练集用于模型学习与训练后,选择残差神经网络(ResNet18)和高效神经网络(EfficientNet-B0)两种模型架构对测试集分别采用五类和二类分类任务进行模型验证。以病理组织学为金标准,评估其诊断效能,从而选出最优模型,并将Grad-CAM层嵌入最优模型中,输出宫腔镜图像Grad-CAM。结果:①在五类分类任务中,EfficientNet-B0模型的准确度(93.23%)高于ResNet18模型(84.23%);EfficientNet-B0模型在诊断无不典型性子宫内膜增生、子宫内膜息肉、子宫内膜癌、子宫内膜非典型增生、黏膜下肌瘤5种疾病的曲线下面积(AUC)均稍高于ResNet18模型,两者的AUC几乎都在0.980以上。②在准确度的二类分类任务中和对特异度的评估中,两种模型相似,均在93.00%以上,而EfficientNet-B0模型敏感度(91.14%)明显优于ResNet18模型(77.22%)。③EfficientNet-B0模型联合Grad-CAM算法可识别出图像中异常区域,取活检经病理检查证实,模型输出热力图中标记区域约95%为病灶区域。结论:EfficientNet-B0模型联合Grad-CAM研发的宫腔镜诊断模型具有较高的诊断准确度、敏感度和特异度,在诊断子宫内膜病变方面具有应用价值。 展开更多
关键词 宫腔镜 子宫内膜癌 卷积神经网络 梯度加权类激活热图 深度学习
在线阅读 下载PDF
基于Grad-CAM与KL损失的SSD目标检测算法 被引量:10
5
作者 侯庆山 邢进生 《电子学报》 EI CAS CSCD 北大核心 2020年第12期2409-2416,共8页
鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细... 鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细节作可视化处理,并以类激活图的形式呈现各检测层细节,分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此,采用Kullback-Leibler(KL)边框回归损失策略,利用Non Maximum Suppression(NMS)算法输出最终预测框.实验结果表明,改进算法相较于已有检测算法具有更高的准确率以及稳定性. 展开更多
关键词 目标检测 可视化 类激活图 Grad-cam SSD KL损失
在线阅读 下载PDF
融合时序与全局上下文特征增强的弱监督动作定位 被引量:1
6
作者 党伟超 范英豪 +1 位作者 高改梅 刘春霞 《计算机应用》 北大核心 2025年第3期963-971,共9页
针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力... 针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力机制捕获视频片段间的时序依赖性;其次,设计基于高斯混合模型(GMM)的期望最大化(EM)算法捕获视频的上下文信息,同时利用二分游走传播进行全局上下文特征增强,生成高质量的时序类激活图(TCAM)作为伪标签在线监督时序特征增强分支;再次,通过动量更新网络得到体现视频间动作特征的跨视频字典;最后,利用跨视频对比学习提高动作分类的准确性。实验结果表明,交并比(IoU)取0.5时,所提方法在THUMOS'14和ActivityNet v1.3数据集上分别取得了42.0%和42.2%的平均精度均值(mAP),相较于CCKEE(Cross-video Contextual Knowledge Exploration and Exploitation)方法,在mAP分别提升了2.6与0.6个百分点,验证了所提方法的有效性。 展开更多
关键词 弱监督动作定位 时序类激活图 动量更新 伪标签监督 特征增强
在线阅读 下载PDF
井下煤炭运输多环节复杂背景下高精度煤矸识别方法
7
作者 栾亨宣 安乐 +7 位作者 田莹 顾颉颖 张强 陈宏伟 付翔 胡成军 崔志芳 陈锐 《煤炭科学技术》 北大核心 2025年第9期459-468,共10页
煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据... 煤矸智能分选是发展煤炭智能绿色开采的关键技术之一。准确识别煤矸石是智能分选的先决条件,如何克服井下复杂环境的影响,已成为影响机器视觉识别效果的现实难题。针对井下煤炭运输系统,构建具有单一、二混合和三混合背景的11类图像数据集,包含水渍、煤粉、碎煤与碎矸石及运输设备部件等背景干扰因素。提出了一种融合多种注意力与残差连接的高精度煤矸智能识别方法,高分辨率阶段使用残差卷积块快速生成高质量标记(token),后续阶段使用级联的Channel Spatial Swin Transformer Block(CSSTB)进行深层表征学习。为提升模型对背景噪声的抗干扰能力,网络集成全局、通道、空间多种注意力机制,增强特征表达的鲁棒性。CSSTB中利用基于负斜率特性强化稀疏激活的LeakyReLU线性注意力机制建模全局信息,通过卷积注意力机制模块(CBAM)优化模型注意力分布,提升模型泛化能力。此外,考虑到煤、矸石和输送设备零部件的尺度差异,跨阶段使用残差连接以增强多尺度特征的通信和信息流通。结果表明:所提模型在单一、二混合和三混合背景上的平均准确度达到95.06%、97.77%、95.65%,相较于基线网络Swin Transformer-Tiny分别提高7.01%、4.83%、1.03%。可视化试验表明,对比模型在水渍、暗光和反光等复杂背景干扰下难以准确区分煤和矸石,而所提出模型能够精准聚焦于煤和矸石的关键特征区域,抗干扰能力强。研究结果为井下原煤运输中的煤矸高效分选提供了理论参考。 展开更多
关键词 深度学习 煤矸识别 井下环境 注意力机制 梯度加权类激活热图
在线阅读 下载PDF
类感知对比学习的弱监督语义分割
8
作者 白雪飞 许文杰 +1 位作者 王渊辉 王文剑 《电子学报》 北大核心 2025年第6期1741-1754,共14页
图像级弱监督语义分割方法通常采用类激活图定位目标物体,但现有方法生成类激活图时存在目标区域激活不足或背景区域误激活等问题.文章提出了一种类感知对比学习的弱监督语义分割框架,通过融合文本提示与图像类别信息,提升模型对目标区... 图像级弱监督语义分割方法通常采用类激活图定位目标物体,但现有方法生成类激活图时存在目标区域激活不足或背景区域误激活等问题.文章提出了一种类感知对比学习的弱监督语义分割框架,通过融合文本提示与图像类别信息,提升模型对目标区域的精确定位能力.首先,文章分析了不同文本提示模板对各类别类激活图的影响,在此基础上,为了获取更具适应性的类别表示,本文构建了一个上下文提示集,并设计上下文提示动态选择策略,根据图像目标区域与文本提示之间的相似性获取最合适的上下文提示.其次,采用图像-文本对比学习方法,以增强模型在处理图像与文本语义对齐任务中的表现,并设计了对比损失函数监督模型的训练过程.最后,提出一个类别特定的背景抑制模块,抑制与目标类别紧密相关的背景区域的误激活,从而生成更加完整和紧凑的类激活图,实现更精确的语义分割.文章在通用数据集PASCAL VOC 2012和MS COCO 2014中对提出的模型进行实验验证,mIoU值分别达到71.9%和43.9%,性能优于所有对比方法,有效提升了弱监督语义分割精度. 展开更多
关键词 弱监督语义分割 类激活图 类感知 对比学习 文本提示
在线阅读 下载PDF
基于CT影像搏动性耳鸣识别及高致病区域
9
作者 田山 王治文 +2 位作者 曹学鹏 苏磊 刘兆会 《北京航空航天大学学报》 北大核心 2025年第2期625-632,共8页
搏动性耳鸣(PT)的病因诊断依赖于影像学检测,但病因众多,缺乏普适性强、机制明确的诊断标准。基于搏动性耳鸣患者和无耳鸣人群的计算机断层扫描(CT)影像横截面图,提出一种高精度的耳鸣识别神经网络模型,并自动标示高致病区域,辅助临床... 搏动性耳鸣(PT)的病因诊断依赖于影像学检测,但病因众多,缺乏普适性强、机制明确的诊断标准。基于搏动性耳鸣患者和无耳鸣人群的计算机断层扫描(CT)影像横截面图,提出一种高精度的耳鸣识别神经网络模型,并自动标示高致病区域,辅助临床诊断。使用迁移学习Resnet-v1-50模型,取骨窗颞骨中部水平截面样本进行分类学习,并以梯度加权类激活映射(gradCAM)方法对分类高权重区域自动标注;统计CT截面大图(全颅)、中图(双侧颞骨)、小图(右侧颞骨)3种数据集的耳鸣分类高权重区域涉及的解剖结构,逐步细化感兴趣区域,提高分类高权重区域标注分辨率。实验结果显示:包含双侧颞骨的中图数据集分类精度最好,测试集精度达到100%。搏动性耳鸣分类高权重区域集中于双侧或单侧颞骨部位,主要包括颞骨蜂房、鼓窦、乙状窦骨板、上鼓室等部位。搏动性耳鸣与颞骨及附近骨质结构有密切关系;搏动性耳鸣患者在双侧颞骨或耳鸣对侧颞骨均有较大概率存在区别于无耳鸣人群的结构异常;颞骨蜂房、鼓窦、乙状窦骨板、鼓室等结构均有较高概率包含搏动性耳鸣的高致病区域。以上影像分析结论与搏动性耳鸣生物力学研究结论实现了相互佐证。 展开更多
关键词 搏动性耳鸣 机器学习 可视化策略 CT影像 神经网络模型 辅助诊断
在线阅读 下载PDF
可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用
10
作者 王璐 刘东 刘卫光 《计算机应用》 北大核心 2025年第1期261-274,共14页
近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNe... 近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNet50和DenseNet121(Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad(Full Gradient-weighted)解释模型识别的判断依据。实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点。可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率。 展开更多
关键词 可变形卷积网络 可解释性 蝴蝶物种识别 类激活映射 显著性移除
在线阅读 下载PDF
基于图像特定分类器的弱监督语义分割
11
作者 郭子麟 吴东岳 +1 位作者 高常鑫 桑农 《自动化学报》 北大核心 2025年第6期1191-1204,共14页
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注.该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化.然而类激活图往往只关注于图像中最显著的区域,致使基于类激活图产生的伪标签与真... 基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注.该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化.然而类激活图往往只关注于图像中最显著的区域,致使基于类激活图产生的伪标签与真实标注存在较大差距,主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题.欠激活源于数据集类内差异过大,致使单一分类器不足以准确识别同一类别的所有像素;错误激活则是数据集类间差异过小,导致分类器不能有效区分不同类别的像素.本文考虑到同一类别像素在图像内的差异小于在数据集中的差异,设计基于类中心的图像特定分类器,以提升对同类像素的识别能力,从而改善欠激活,同时考虑到类中心是类别在特征空间的代表,设计类中心约束函数,通过扩大类中心间的差距从而间接地疏远不同类别的特征分布,以缓解错误激活现象.图像特定分类器可以插入其他弱监督语义分割网络,替代分类网络的分类器,以产生更高质量的类激活图.实验结果表明,本文所提出的方案在两个基准数据集上均具有良好的表现,证实了该方案的有效性. 展开更多
关键词 语义分割 图像级标签 分类器 类激活图 弱监督学习
在线阅读 下载PDF
基于语义调制的弱监督语义分割
12
作者 李军侠 苏京峰 +1 位作者 崔滢 刘青山 《软件学报》 北大核心 2025年第9期4373-4387,共15页
图像级标注下的弱监督语义分割方法通常采用卷积神经网络(CNN)生成类激活图以精确定位目标位置,其面临的主要挑战在于CNN对全局信息感知能力的不足导致前景区域过小的问题.近年来,基于Transformer的弱监督语义分割方法利用自注意力机制... 图像级标注下的弱监督语义分割方法通常采用卷积神经网络(CNN)生成类激活图以精确定位目标位置,其面临的主要挑战在于CNN对全局信息感知能力的不足导致前景区域过小的问题.近年来,基于Transformer的弱监督语义分割方法利用自注意力机制捕捉全局依赖关系,解决了CNN的固有缺陷.然而,Transformer生成的初始类激活图会在目标区域周围引入大量背景噪声,此时直接对初始类激活图进行使用并不能取得令人满意的效果.通过综合利用Transformer生成的类与块间注意力(class-to-patch attention)以及区域块间注意力(patch-to-patch attention)对初始类激活图进行联合优化,同时,由于原始的类与块间注意力存在误差,对此设计一种语义调制策略,利用区域块间注意力的语义上下文信息对类与块间注意力进行调制,修正其误差,最终得到能够准确覆盖较多目标区域的类激活图.在此基础上,构建一种新颖的基于Transformer的弱监督语义分割模型.所提方法在PASCAL VOC 2012验证集和测试集上mIoU值分别达到72.7%和71.9%,MS COCO 2014验证集上mIoU为42.3%,取得了目前较为先进的弱监督语义分割结果. 展开更多
关键词 语义分割 弱监督学习 语义上下文 TRANSFORMER 类激活图
在线阅读 下载PDF
基于生成对抗网络的舌象图像特征提取方法
13
作者 阮群生 王硕诚 吴清锋 《计算机科学与探索》 北大核心 2025年第11期3007-3022,共16页
舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图... 舌诊是中医特色诊法之一,《医镜》深刻阐释了舌象与人体健康状况、脏腑病变的密切关系。因此,现代中医智能舌诊的重要工作便是舌象图像特征处理,针对舌象图像特征分布规律的学习和特征提取困难的问题,提出一种基于生成对抗网络的舌象图像特征提取新方法(TongueIFE-GAN)。该方法通过对抗思想构建一种面向舌象图像潜在特征的提取网络,它包括判别器和生成器两个重要组成部分,藉此建立图像重构质量与舌象图像的特征提取效果映射关系。为增强深度算法的可解释性,在网络判别器中融入类激活映射机制,进一步优化编码器的特征处理性能,并对TongueIFE-GAN模型在提取特征时关注的图像敏感区域作出可视化解释。同时,在舌象图像分割、分类任务驱动下,新模型可自优化舌象特征提取的能力。通过多组实验,结果表明,基于TongueIFE-GAN模型的舌象分割和分类任务,其分割性能IoU与Dice指标值,以及分类准确率均优于基准模型和对比方法。TongueIFE-GAN利用对抗思想构建新型的特征提取以及注意力可视化机制的研究方法,可为舌象图像特征研究提供一种新的思路。 展开更多
关键词 生成对抗网络 舌象图像 类激活映射 舌象图像分割 舌象分类
在线阅读 下载PDF
基于可解释深度学习及表面增强拉曼光谱的微塑料高效识别方法
14
作者 张艺严 马静 +1 位作者 孙振丽 杜晶晶 《分析测试学报》 北大核心 2025年第8期1557-1567,共11页
微塑料(MPs)污染已成为全球环境的重大挑战。传统检测方法在MPs检测中存在诸多局限,迫切需要开发无需复杂前处理的高灵敏检测技术。为解决MPs检测难题,该研究构建了一种“表面增强拉曼散射基底捕获-深度学习识别-梯度加权类激活映射(Gra... 微塑料(MPs)污染已成为全球环境的重大挑战。传统检测方法在MPs检测中存在诸多局限,迫切需要开发无需复杂前处理的高灵敏检测技术。为解决MPs检测难题,该研究构建了一种“表面增强拉曼散射基底捕获-深度学习识别-梯度加权类激活映射(Grad-CAM)解释”的MPs新型检测方法。研究结果表明,金纳米海绵基底可有效捕获MPs,数据增强与预处理技术可有效提高模型的预测精度。基于一维卷积神经网络(1D-CNN)的多分支二分类深度学习网络对MPs的分类准确率可达85%,显著高于机器学习模型与常规1DCNN模型。Grad-CAM分析可清晰展示模型决策依据及误判原因。该方法在实际环境水样及混合样本中验证有效,具有较强抗干扰性能与实用性;所用基底材料来源广泛、制备工艺简便,具有成本优势与良好的应用潜力。 展开更多
关键词 表面增强拉曼光谱 微塑料 卷积神经网络 深度学习 梯度加权类激活映射
在线阅读 下载PDF
多头自注意力与双线性池化融合的心肌缺血影像分类
15
作者 周嘉文 郑小盈 +5 位作者 祝永新 林思敏 陈凌曜 曾洪斌 郭俞 王馨莹 《计算机工程》 北大核心 2025年第11期246-257,共12页
深度学习在心肌缺血辅助诊断中有重要应用价值,但传统深度学习医学图像分类网络存在无法捕捉心肌计算机断层扫描(CT)类别间细微差异、丢失CT数据三维(3D)结构信息等问题。为此,提出一种DBTMed3D网络,采用3D双线性细粒度池化对传统Med3D... 深度学习在心肌缺血辅助诊断中有重要应用价值,但传统深度学习医学图像分类网络存在无法捕捉心肌计算机断层扫描(CT)类别间细微差异、丢失CT数据三维(3D)结构信息等问题。为此,提出一种DBTMed3D网络,采用3D双线性细粒度池化对传统Med3D网络中的卷积模块进行改进,用于处理包括CT和MRI在内的多模态医学图像数据。同时,模仿ResNet网络,在模块中引入跳跃连接,融合图像细粒度二阶特征和卷积模块提取到的特征,使得网络在关注局部特征的同时保留整体特征。此外,引入3D类别激活图,将热力图叠加在原心肌图像的CT切片上,突出网络模型重点关注的心肌位置。最后,设计3D层次化多头自注意力模块,通过捕获图像局部特征解决3D医学图像的细粒度分类问题。实验结果表明,DBTMed3D在心肌CT数据集上的分类准确率为86.4%,相比基准网络3D ResNet-50提升了6.7百分点,具有较优的分类效果。 展开更多
关键词 心肌缺血 卷积神经网络 双线性细粒度 多头自注意力机制 类别激活图 跳跃连接
在线阅读 下载PDF
基于合作博弈Shapley值法的类激活映射算法
16
作者 许莉 常雨晴 +2 位作者 柴霁轩 宛旭 范纯龙 《计算机工程与设计》 北大核心 2025年第3期795-803,共9页
为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权... 为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权重对特征图进行加权求和,得到类激活图,对神经网络模型的决策机制进行解释。重点考虑网络最后一层中每个特征图对结果的影响,可视化输入图像中对模型输出造成正向影响的区域。实验结果表明,该方法能够更准确地解释深度神经网络的决策依据,在定位能力和算法忠诚度等方面的性能得到了显著提升。 展开更多
关键词 深度神经网络 特征重要性 类激活映射 可解释性 合作博弈 沙普利值 特征图
在线阅读 下载PDF
利用多种子信息聚合和正负混合学习的弱监督图像语义分割
17
作者 桑雨 刘通 +3 位作者 马天娇 李乐 李思漫 刘宇男 《电子与信息学报》 北大核心 2025年第10期3993-4004,共12页
基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理... 基于图像级标签的弱监督语义分割(WSSS)旨在通过类激活映射(CAM)生成伪标签(种子),然后将其用于训练语义分割模型,为耗时且昂贵的像素级标注节省大量人力和财力。现有方法主要围绕CAM进行改进以获取单个优良的种子,同时通过一些后处理手段进一步提升种子的质量,但其得到的种子仍存在不等程度的噪声。为了减少噪声标签对分割网络造成的影响,考虑多个不同种子更能有效提取出正确信息,该文从多种子信息互补的角度,提出一种基于多种子信息聚合和正负混合学习的弱监督图像语义分割方法,通过在分类网络中改变输入图像尺度以及调整Dropout层随机隐藏神经元的概率,获取多个优良种子;依据它们对每个像素分配的类别标签情况进行优选获得聚合种子,并进一步区分该像素标签为干净标签还是噪声标签;利用正负混合学习训练语义分割网络,引入预测约束损失以避免网络对噪声标签给予过高的预测值,进而对干净标签应用正学习发挥正确信息的准确性,对噪声标签应用负学习抑制错误信息的影响,从而有效提升分割网络的性能。在PASCAL VOC 2012和MS COCO 2014验证集上实验结果表明,该文方法在基于卷积神经网络框架的分割网络中,mIoU分别达到了72.5%和40.8%,与RCA及URN方法相比分别提升了0.3%与0.1%;在基于Transformer框架的分割网络中,mIoU则提升至76.8%和46.7%,与CoBra及ECA方法相比分别提升了2.5%与1.6%,验证了方法的有效性。 展开更多
关键词 弱监督语义分割 类激活映射 多种子 交叉熵 正负学习
在线阅读 下载PDF
基于深度学习的太阳黑子群磁类型分类
18
作者 尹耀 李依洋 +6 位作者 黄狮勇 徐思博 袁志刚 吴红红 姜奎 熊启洋 林仁桐 《空间科学学报》 北大核心 2025年第2期253-265,共13页
太阳活动作为太阳大气层中能量释放和物质运动的显著表现形式,是空间天气的主要扰动源,以太阳黑子为代表的剧烈太阳活动可能导致近地空间环境的剧烈变化,进而对人类的生产生活产生深远影响.准确、高效地预报空间天气有助于减少其对人类... 太阳活动作为太阳大气层中能量释放和物质运动的显著表现形式,是空间天气的主要扰动源,以太阳黑子为代表的剧烈太阳活动可能导致近地空间环境的剧烈变化,进而对人类的生产生活产生深远影响.准确、高效地预报空间天气有助于减少其对人类生产生活的影响.本文利用2010-2017年太阳动力学天文台(Solar Dynamics Observatory,SDO)搭载的HMI仪器观测的连续谱图和磁图数据,建立了基于压缩激励模块和深度残差网络的太阳黑子威尔逊山磁类型分类模型.为了有效避免因时间序列连续性导致的模型过拟合问题,采用时序分割法划分数据集,并结合太阳黑子图像的特点应用了数据增强策略,以提高模型的泛化能力.结果表明,提出的模型能够较准确地完成太阳黑子磁分类任务,尤其是在复杂类型黑子的识别方面,相较于传统方法其识别能力得到了显著的提升.此外,使用类激活映射方法对测试集样本进行了可视化研究,分析了模型提取到的特征图像和分类依据,从而提高模型的可解释性. 展开更多
关键词 太阳黑子 深度残差网络 压缩激励模块 数据增强 类激活映射
在线阅读 下载PDF
基于空间权重和层间相关性的可解释浅层类激活映射算法研究
19
作者 程艳 何慧娟 +2 位作者 陈彦滢 姚楠楠 林国波 《计算机科学》 北大核心 2025年第S1期498-504,共7页
卷积神经网络在计算机视觉领域具有重要作用,然而其黑盒特性使人们理解其决策理由变得困难,严重阻碍了其在某些安全领域的应用。传统的类激活映射(Class Activation Mapping,CAM)算法通常受限于深层神经元的可解释性,对浅层神经元的解... 卷积神经网络在计算机视觉领域具有重要作用,然而其黑盒特性使人们理解其决策理由变得困难,严重阻碍了其在某些安全领域的应用。传统的类激活映射(Class Activation Mapping,CAM)算法通常受限于深层神经元的可解释性,对浅层神经元的解释能力较弱且存在较多噪声。为了应对这一挑战,提出一种可解释浅层的类激活映射算法,并生成细粒度的解释。该算法基于相关性传播理论,考虑相邻层之间的相关性,得到层间相关性权重,并将应用了空间权重的特征图作为掩码,与层间相关性权重相乘,从而实现浅层解释。实验结果表明,所提算法与解释浅层最优的LayerCAM相比,卷积神经网络每层生成的类激活图的删除插入测试综合评分在ILSVRC2012 val数据集上最高提高了2.73,最低提高了0.24,在CUB-200-2011数据集上最高提高了1.31,最低提高了0.38。 展开更多
关键词 类激活映射算法 卷积神经网络 浅层神经元 空间权重 层间相关性
在线阅读 下载PDF
基于多分支神经网络模型的弱监督细粒度图像分类方法 被引量:7
20
作者 边小勇 江沛龄 +2 位作者 赵敏 丁胜 张晓龙 《计算机应用》 CSCD 北大核心 2020年第5期1295-1300,共6页
针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络Res... 针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题,提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先,用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,设计可变形卷积的残差网络ResNet-50和旋转不变编码的方向响应网络(ORN);其次,利用预训练模型分别初始化特征网络,并输入原图和以上局部区域分别对模型进行微调;最后,组合三个分支内损失和分支间损失优化整个网络,对测试集进行分类预测。所提方法在CUB-200-2011和FGVC_Aircraft数据集上的分类准确率分别达到87.7%和90.8%,与多注意力卷积神经网络(MA-CNN)方法相比,分别提高了1.2个百分点和0.9个百分点;在Aircraft_2数据集上的分类准确率达到91.8%,比ResNet-50网络提高了4.1个百分点。实验结果表明,所提方法有效提高了弱监督细粒度图像分类的准确率。 展开更多
关键词 细粒度图像分类 深度学习 弱监督 可变形卷积 类激活图 方向响应网络
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部