期刊文献+
共找到447篇文章
< 1 2 23 >
每页显示 20 50 100
基于多维注意力模块的轻量化混凝土裂缝检测方法
1
作者 许华杰 郑力文 +1 位作者 张品 秦远卓 《计算机工程》 北大核心 2025年第5期351-360,共10页
为解决当前混凝土裂缝检测模型庞大难以部署到移动端设备且裂缝检测不准及漏检问题,提出一种基于多维注意力模块的轻量化混凝土裂缝检测方法。该方法针对当前主流的裂缝检测模型庞大的问题,采用深度可分离卷积对YOLOv5s中的CBS特征提取... 为解决当前混凝土裂缝检测模型庞大难以部署到移动端设备且裂缝检测不准及漏检问题,提出一种基于多维注意力模块的轻量化混凝土裂缝检测方法。该方法针对当前主流的裂缝检测模型庞大的问题,采用深度可分离卷积对YOLOv5s中的CBS特征提取模块进行重构,得到轻量化CBS(LCBS)特征提取模块,以减少网络的参数量及计算量;针对裂缝检测不准的问题,提出一种多尺度特征(MSF)提取模块用于替换YOLOv5s第1层的卷积层,以增强网络对不同尺寸裂缝特征的提取能力;针对裂缝漏检问题,提出融合空间及通道信息的多维注意力(MDA)模块,以增强裂缝特征提取能力和减少裂缝漏检。实验结果表明,所提方法比YOLOv5s参数量减少了35.2%,计算量减少了50.9%,模型规模减小了32.8%,且平均精度均值(mAP@0.5)提高了4.2百分点,与目前主流的同类目标检测方法相比,具有较低的参数量和较高的检测精度。 展开更多
关键词 裂缝检测 注意模块 轻量化 YOLOv5s模型 目标检测
在线阅读 下载PDF
基于多层次瓶颈注意力模块的颅骨到面皮的生成方法
2
作者 王洁 姜文凯 +3 位作者 蒋佳琪 梁增磊 刘晓宁 耿国华 《西北大学学报(自然科学版)》 北大核心 2025年第1期201-212,共12页
从未知颅骨恢复其生前面貌是考古学、法医学和刑侦学重要的研究方向。现有的计算机三维辅助复原过程繁琐,耗时长,该研究针对现有模型在颅骨到面皮(不含纹理、头发等的面貌)图像生成上存在失真、扭曲、不平滑等现象,提出一种结合生成对... 从未知颅骨恢复其生前面貌是考古学、法医学和刑侦学重要的研究方向。现有的计算机三维辅助复原过程繁琐,耗时长,该研究针对现有模型在颅骨到面皮(不含纹理、头发等的面貌)图像生成上存在失真、扭曲、不平滑等现象,提出一种结合生成对抗网络和多层次瓶颈注意力模块的颅骨到面皮图像生成方法。该方法的生成器由6层AdaResBlock和瓶颈注意力模块组成,从通道和空间两个维度引导生成器关注更重要的区域,并根据特征自适应地调整归一化方式。同时,针对生成器模型较大的问题,引入蓝图可分离卷积减小其体积。此外,将判别器分为两部分,前几层被用来进行编码,取消传统网络中的单独编码器模块,使模型更紧凑;后几层则采用多尺度判别策略,从不同层级对图像进行分类判别,增强其准确性。实验结果表明,在颅骨到面皮图像生成任务上,该方法生成的面皮图像质量高于现有的其他方法,在视觉质量和图像质量上都取得了最高的分数,复原效果更加真实,图像定量评价指标PSNR、SSIM平均提升1.115,0.017,LPIPS平均降低0.026,面皮平均相似度为0.855。 展开更多
关键词 颅面生成 生成对抗网络 图像转换 瓶颈注意模块 蓝图可分离卷积
在线阅读 下载PDF
基于混合注意力模块改进StarGAN的水下图像增强
3
作者 郑浩君 王振 +4 位作者 张佳鹏 刘胜男 钱程 涂雪滢 刘世晶 《南方水产科学》 北大核心 2025年第1期185-196,共12页
围绕水下图像色偏和模糊的特点,针对不同浑浊度的水下图像差异较大问题,提出了一种基于混合注意力模块(Convolutional block attention module,CBAM)改进的星型生成对抗网络(Star generative adversarial networks,StarGAN)用于水下多... 围绕水下图像色偏和模糊的特点,针对不同浑浊度的水下图像差异较大问题,提出了一种基于混合注意力模块(Convolutional block attention module,CBAM)改进的星型生成对抗网络(Star generative adversarial networks,StarGAN)用于水下多浑浊图像增强。首先使用水下相机采集实验室和养殖平台环境2组水下多浊度图像数据集;其次优化StarGAN,在每个ResidualBlock模块后引入一个由通道注意力模块和空间注意力模块串联组成的CBAM;最后进行消融实验,并与其他方法比较,使用水下图像质量评估(Underwater image quality measurement,UIQM)、水下彩色图像质量评估(Underwater color image quality evaluation,UCIQE)和图像熵作为图像质量评价指标。结果表明,实验室数据集增强后,UIQM达到1.18,UCIQE达到30.13,图像熵达到12.83;养殖平台数据集增强后,UIQM达到0.52,UCIQE达到10.35,图像熵达到9.94。该方法对实验室和养殖平台环境中不同浑浊度的图像增强均有较好的效果,在消融实验及与其他方法的比较中,该方法的得分均为最高。 展开更多
关键词 多浑浊度图像 水下图像增强 注意模块 星型生成对抗网络
在线阅读 下载PDF
集成边缘门控与多尺度空间注意的排水管道缺陷分割模型
4
作者 陈登峰 赵航辉 +2 位作者 刘世鹏 孟屯良 王泽鹏 《测绘通报》 北大核心 2025年第6期97-102,共6页
城镇地下排水管道老化问题导致管道破损、堵塞等现象频发。人工检测方法难以满足不断增长的检测需求,现有智能化检测技术在应对形状不规则、细节丰富的缺陷边界时,其交并比仍存在提升空间。本文提出了一种提升缺陷边界识别性能的排水管... 城镇地下排水管道老化问题导致管道破损、堵塞等现象频发。人工检测方法难以满足不断增长的检测需求,现有智能化检测技术在应对形状不规则、细节丰富的缺陷边界时,其交并比仍存在提升空间。本文提出了一种提升缺陷边界识别性能的排水管道语义分割模型PGGNet,模型中的GEA通过拉普拉斯边缘检测算法整合边缘特征,提高了对缺陷边界的捕捉能力;MGSA-SSM则结合状态空间模型和MGSA的多尺度机制,引导模型从不同尺度捕捉缺陷的全局轮廓与局部细节,从而提升复杂边界的识别能力。试验结果表明,PGGNet在与主流算法对比中表现出色,mPA达94.32%,mIoU达93.08%,可满足排水管道自动化缺陷检测需求。 展开更多
关键词 城镇地下排水管道 缺陷检测 PGGNet 门控机制 多尺度引导空间注意模块
在线阅读 下载PDF
基于DenseNet和卷积注意力模块的高精度手势识别 被引量:5
5
作者 赵雅琴 宋雨晴 +3 位作者 吴晗 何胜阳 刘璞秋 吴龙文 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期967-976,共10页
非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷... 非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷达的微动手势识别方法。采用4片AWR1243雷达板级联而成的毫米波级联(MMWCAS)雷达采集手势回波,对手势回波进行时频分析,基于距离-多普勒(RD)图和3D点云检测出人手目标。通过数据预处理,提取手势目标的距离-时间谱图(RTM)、多普勒-时间谱图(DTM)、方位角-时间谱图(ATM)和俯仰角-时间谱图(ETM),更加全面地表征手势的运动特征,并形成混合特征谱图(FTM),对12种微动手势进行识别。设计了基于DenseNet和卷积注意力模块的手势识别网络,将混合特征谱图作为网络的输入,创新性地融合了卷积注意力模块(CBAM),实验表明,识别准确率达到99.03%,且该网络将注意力放在手势动作的前半段,实现了高精度的手势识别。 展开更多
关键词 手势识别 毫米波雷达 卷积神经网络 卷积注意模块
在线阅读 下载PDF
基于特征相似性和特征规范化的注意力模块 被引量:1
6
作者 杜启亮 汪益民 田联房 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第7期62-71,共10页
近年来,注意力机制在图像分类、目标检测和语义分割等领域取得了巨大成功,但现有的注意力机制大多只能在通道或空间维度上实现特征融合,这极大限制了其在通道和空间维度上变化的灵活性,导致无法充分利用特征信息。为此,文中提出一种基... 近年来,注意力机制在图像分类、目标检测和语义分割等领域取得了巨大成功,但现有的注意力机制大多只能在通道或空间维度上实现特征融合,这极大限制了其在通道和空间维度上变化的灵活性,导致无法充分利用特征信息。为此,文中提出一种基于特征相似性和特征规范化的、可同时利用特征图各维度信息的卷积神经网络注意力模块FSNAM。该模块由特征相似性模块(FSM)和特征规范化模块(FNM)两部分组成,FSM利用输入特征图的通道特征信息和局部空间特征信息生成一个二维的特征相似性权重图;FNM利用输入特征图的全局空间特征信息生成一个三维的特征规范化权重图;两个模块生成的权重图融合在一起,生成一个三维的注意力权重图,以此实现通道特征信息和空间特征信息的融合。为证明FSNAM的可行性和有效性,进行了消融实验,结果表明:在图像分类任务方面,FSNAM模块对分类网络在CIFAR数据集上的性能提升明显优于其他主流注意力模块;在目标检测任务方面,使用FSNAM模块的目标检测网络对VOC数据集中的小目标和中等大小目标的检测准确率分别提高了3.9和1.2个百分点;在语义分割任务方面,使用FSNAM模块可以提高HRNet模型的性能,在SBD数据集上模型的平均像素准确率提高了0.58个百分点。 展开更多
关键词 卷积神经网络 计算机视觉 特征相似性 特征规范化 注意模块
在线阅读 下载PDF
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
7
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 TRANSFORMER 注意模块 梯度融合
在线阅读 下载PDF
基于深度可分离卷积与注意力机制的单导联心房颤动轻量级分类网络
8
作者 洪永 张鑫 +2 位作者 林铭俊 吴秋岑 陈超敏 《南方医科大学学报》 北大核心 2025年第3期650-660,共11页
目的设计一个深度学习模型,实现模型复杂度和模型性能的平衡,以便于集成到可穿戴心电监护设备上,实现本地的房颤自动诊断。方法从公开数据集LTAFDB、AFDB和NSRDB上分别收集了84例、25例房颤患者和18例无明显心律失常受试者的数据进行实... 目的设计一个深度学习模型,实现模型复杂度和模型性能的平衡,以便于集成到可穿戴心电监护设备上,实现本地的房颤自动诊断。方法从公开数据集LTAFDB、AFDB和NSRDB上分别收集了84例、25例房颤患者和18例无明显心律失常受试者的数据进行实验和测试。提出了一个基于深度可分离卷积并融合通道空间信息的轻量级注意网络—DSC-AttNet,引入深度可分离卷积代替标准卷积,降低模型参数量和计算量,实现模型的高效和轻量化;并嵌入多层混合注意力机制以在不同尺度上计算通道信息和空间信息的注意权重,提高模型的特征表达能力。在LTAFDB上进行十折交叉验证,并在AFDB和NSRDB上进行外部独立测试。结果DSC-AttNet在测试集上的十折平均准确率达到97.33%,精确率达到97.30%,均优于其他4个对比模型以及3个经典模型。模型在外部测试集上的准确率分别达到92.78%和99.97%,优于3个经典模型。且DSC-AttNet的参数量为1.01M,计算量为27.19 G,小于3个经典模型。结论该房颤分类方法具有较小的复杂度,达到了更好的分类性能,并且泛化能力较好,具有良好的临床应用前景和推广能力。 展开更多
关键词 心电图 心房颤动 卷积块注意模块 MobileNet 轻量级卷积神经网络
在线阅读 下载PDF
一种多尺度循环残差注意的单幅图像去雨方法
9
作者 刘邱铃 周刚 乔敏 《计算机应用与软件》 北大核心 2025年第2期236-240,279,共6页
目前基于卷积神经网络的去雨方法,存在雨纹残留、图像模糊等问题。为此提出一种基于多尺度特征提取和循环残差注意的单幅图像去雨方法。通过构建多尺度拉普拉斯金字塔得到多尺度特征图,再设计循环残差注意模块加强阶段间联系、提取深度... 目前基于卷积神经网络的去雨方法,存在雨纹残留、图像模糊等问题。为此提出一种基于多尺度特征提取和循环残差注意的单幅图像去雨方法。通过构建多尺度拉普拉斯金字塔得到多尺度特征图,再设计循环残差注意模块加强阶段间联系、提取深度特征、增强重要特征权重,更好地去除雨纹并保留了图像细节。实验结果表明,该方法的去雨效果优于其他去雨算法。 展开更多
关键词 卷积神经网络 单幅图像去雨 多层拉普拉斯金字塔 多尺度特征图 循环残差注意模块
在线阅读 下载PDF
针对X线图像超分辨率重建的轻量残差注意力网络
10
作者 杨昆 齐晁仪 +4 位作者 刘天军 艾尚璞 闫森广 刘秀玲 薛林雁 《河北大学学报(自然科学版)》 北大核心 2025年第4期419-430,共12页
针对当前医学图像超分辨率重建算法复杂、参数量大等问题,提出了轻量化的X线医学图像超分辨率网络LDRAN(lightweight deep residual attention network).该方法设计了轻量且高效的残差块LDRB(lightweight deep residual block),在保证... 针对当前医学图像超分辨率重建算法复杂、参数量大等问题,提出了轻量化的X线医学图像超分辨率网络LDRAN(lightweight deep residual attention network).该方法设计了轻量且高效的残差块LDRB(lightweight deep residual block),在保证参数量不增加的条件下,通过增设卷积层来提取更为丰富的图像特征.为进一步提高卷积层间的信息传递效率,设计了一种新颖的残差级联方案IRSC(improved residual skip concatenation).同时,为应对医学影像中信噪比低的问题,构建了多维混合注意力机制模块CSPMA(channel-spatial-pixel mixed attention),该模块分别从通道、空间和像素3个维度筛选信息,从而显著增强了网络对关键图像特征的捕捉能力.实验结果表明,LDRAN在X线医学图像数据集Chest X-ray上的PSNR为36.81 dB,SSIM为0.8966,均取得了最优.并且能够更好地重建X线图像的细节和纹理.此外,LDRAN在3个自然图像数据集上的重建效果比多数具有代表性的算法更好. 展开更多
关键词 超分辨重建 轻量化 深度残差块 混合多维度注意模块 残差级联
在线阅读 下载PDF
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
11
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意模块 特征融合
在线阅读 下载PDF
基于梯度可感知通道注意力模块的红外小目标检测前去噪网络 被引量:4
12
作者 林再平 罗伊杭 +5 位作者 李博扬 凌强 郑晴 杨晶贻 刘丽 吴京 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2024年第2期254-260,共7页
红外图像去噪在军事及民用领域应用广泛。现有基于深度学习的图像去噪方法主要为可见光图像设计,此类方法容易过度平滑图像细节,从而导致弱小目标丢失,为后续的检测任务带来困难。为了在去除噪声的同时保留好红外图像中的目标信息,本文... 红外图像去噪在军事及民用领域应用广泛。现有基于深度学习的图像去噪方法主要为可见光图像设计,此类方法容易过度平滑图像细节,从而导致弱小目标丢失,为后续的检测任务带来困难。为了在去除噪声的同时保留好红外图像中的目标信息,本文提出了一种基于梯度可感知通道注意力模块的红外弱小目标检测前去噪网络。该网络首先采用编码器-解码器结构来去除图像中的加性噪声,然后通过梯度可感知通道注意力模块对图像高频区域进行自适应增强,有效保持红外弱小目标的响应强度。此外,本文提出了领域第一个包含3981张含噪声的红外图像数据集。实验结果表明,该网络能够在有效去除加性噪声的同时避免过度平滑,很好地保留了红外图像中的目标信息,最终实现了在含噪声环境下的高鲁棒性红外弱小目标检测。 展开更多
关键词 红外小目标 检测前去噪 梯度可感知通道注意模块
在线阅读 下载PDF
多尺度融合增强与注意力机制结合的图像语义分割
13
作者 刘书刚 杜昊东 王洪涛 《计算机应用与软件》 北大核心 2025年第6期225-233,278,共10页
针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特... 针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特征信息进行融合,在解码器末端使用改进的轻量化卷积注意力模块,使得对于物体边界分割更加充分。通过在Pascal VOC2007和Cityscapes数据集上进行实验验证,结果表明该方法较原有网络的精确度有显著的提高。 展开更多
关键词 语义分割 特征融合增强 注意模块 编码器 上采样
在线阅读 下载PDF
基于注意力模块的移动设备多场景持续身份认证 被引量:3
14
作者 金瑜瑶 张晓梅 王亚杰 《计算机工程与应用》 CSCD 北大核心 2024年第3期280-291,共12页
针对用户与移动设备交互时会产生场景变化,现有工作中只能采集特定的单一场景特征,无法实现多场景转换认证,并且身份认证准确率较低的问题,提出了一种基于移动模式的、注意力模块和卷积神经网络融合(CNNSACA)的多场景持续认证方案。在... 针对用户与移动设备交互时会产生场景变化,现有工作中只能采集特定的单一场景特征,无法实现多场景转换认证,并且身份认证准确率较低的问题,提出了一种基于移动模式的、注意力模块和卷积神经网络融合(CNNSACA)的多场景持续认证方案。在不限使用场景和操作的情况下,提取用户与移动设备交互时的移动模式(movement patterns,MP)特征,捕捉在动态和静态场景下产生的手部微运动,从而实现多场景的身份认证。设计并使用了一个包括五层卷积层结构的卷积神经网络,在第一层卷积后按序通过改进的空间和通道注意力子模块,再在多层卷积后进行反序分配权重,从两个维度来对通过卷积后所表征的MP特征分配双重注意力权重,增强关键特征表达。利用公开数据集验证所提方案在多场景身份认证方面的有效性和可行性。实验结果表明,所提出的基于移动模式的深度学习模型可以较好地解决身份认证场景单一的局限性,多场景的身份认证的准确率达到99.6%;同时,所提出的CNN-SACA模型与单独的CNN模型相比准确率提高了1.5个百分点,有效改善多场景下的移动设备身份认证能力。 展开更多
关键词 卷积神经网络 注意模块 多场景 持续身份认证 移动设备
在线阅读 下载PDF
基于密集多尺度特征和双注意力模块的皮肤病变分割 被引量:2
15
作者 费承 罗健旭 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期97-105,共9页
针对皮肤病变分割任务中病变区域大小不一、形状各异、内部像素差异大、边界模糊、周围存在气泡等问题,提出了一种基于密集多尺度特征和双注意力模块的U型分割网络DDAnet。该网络中的DenseASPP模块通过密集连接多个空洞卷积层来获取丰... 针对皮肤病变分割任务中病变区域大小不一、形状各异、内部像素差异大、边界模糊、周围存在气泡等问题,提出了一种基于密集多尺度特征和双注意力模块的U型分割网络DDAnet。该网络中的DenseASPP模块通过密集连接多个空洞卷积层来获取丰富的多尺度信息,同时由通道注意力模块(CAM)和位置注意力模块(PAM)构成的双注意力模块通过编码全局上下文信息,在通道和位置上对特征图进行重新配准,实现对相关特征的强调和对无关特征的抑制。两个模块并行连接、共同作用以提高分割精度。在ISIC2018数据集上,DDAnet的准确率(Acc)、Jaccard相似系数(JI)、Dice系数(DC)、敏感度(Sen)和特异性(Spec)指标值分别为96.75%、85.00%、91.36%、91.82%和97.42%,分割结果优于其他的分割网络,并且对于极具挑战的病例,DDAnet仍然能够产生准确、可靠的分割结果,说明其具备在临床诊断中辅助医生进行皮肤病变分割的潜力。 展开更多
关键词 皮肤病变分割 DenseASPP模块 CAM PAM 注意模块
在线阅读 下载PDF
融合监督注意力模块和跨阶段特征融合的图像修复改进网络 被引量:2
16
作者 黄巧玲 郑伯川 +1 位作者 丁梓成 吴泽东 《计算机应用》 CSCD 北大核心 2024年第2期572-579,共8页
非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两... 非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两阶段网络模型上,引入了SAM与CSFF模块。SAM通过提供真实图像监督信号,监督上阶段输出特征,确保传入下阶段特征信息的有效性。CSFF将上阶段编码器-解码器的特征融合后送入下阶段的编码器,以弥补上阶段修复中特征信息的损失。实验结果表明,在缺失区域占比为1%~10%时,相较于基线模型Gconv,Gconv_CS在CelebA-HQ数据集上峰值信噪比(PSNR)和结构相似性指数(SSIM)分别提高了1.5%和0.5%,Fréchet起始距离(FID)和L1损失分别降低了21.8%、14.8%;在Place2数据集上,前2个指标分别提高了26.7%和0.8%,后2个指标分别降低了7.9%、37.9%。将Gconv_CS用于去除大熊猫面部遮挡物时,取得了较好的修复视觉效果。 展开更多
关键词 图像修复 两阶段网络 跨阶段特征融合 监督注意模块 门控卷积
在线阅读 下载PDF
结合超轻量级双注意力模块的ShuffleNetV2面部表情识别 被引量:1
17
作者 林恩惠 王凡 谭晓玲 《电子测量技术》 北大核心 2024年第10期168-174,共7页
针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征... 针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征捕获与分类能力。此外,本文创新性地引入了一种超轻量级双注意力模块LDAM,该模块结合了DCAM注意力机制与空间注意力机制,并通过捷径连接技术集成到优化后的ShuffleNetV2模型中,以增强模型对细节特征的识别能力及分类效果。在FER2013和CK+两大公认的面部表情识别数据集上的实验结果显示,本方法分别达到了69.12%和94.77%的识别准确率,同时保持了低至1.25的模型参数量。这一成果不仅展示了在保持模型轻量化的同时提升识别性能的可能性,而且通过实验验证了所提出方法的高效性和实用性。 展开更多
关键词 面部表情识别方法的改进 激活函数 空间注意力机制 轻量化模型 超轻量级双注意模块
在线阅读 下载PDF
基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型
18
作者 孔哲 李寒 +5 位作者 甘少伟 孔明茹 何冰涛 郭子钰 金督程 邱兆文 《计算机应用》 CSCD 北大核心 2024年第7期2216-2224,共9页
针对肾脏结构中,因不同结构间差异大,动静脉体积小、结构薄及计算机断层扫描血管造影(CTA)图像灰度分布不均和伪影带来的精确分割困难的问题,提出基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型MDAUnet(MultiDecoder-Attent... 针对肾脏结构中,因不同结构间差异大,动静脉体积小、结构薄及计算机断层扫描血管造影(CTA)图像灰度分布不均和伪影带来的精确分割困难的问题,提出基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型MDAUnet(MultiDecoder-Attention-Unet)。首先,针对不同结构间差异大导致网络无法共享权重的问题,采用多解码器结构,为语义结构不同的特征结构匹配不同的解码器分支;其次,针对血管体积小、结构薄难分割的问题,引入非对称的空间通道联合注意力模块使模型更关注管状结构,并对学习到的特征信息同时进行空间维度和通道维度的校准;最后,为了保证模型在反向传播中对血管结构有足够的关注,提出改进的加权硬区域适应损失(WHRA)作为损失函数来动态保持训练过程中血管结构的类间平衡以及保留背景信息的特征;此外,为了提高特征图灰度值的对比度,将传统图像处理边缘检测算子嵌入模型的预处理阶段,对待分割的感兴趣区域边界进行特征增强使模型更关注边界信息并抑制伪影信息。实验结果表明:所提出的MDAUnet模型在肾脏结构分割任务上的Dice相似系数(DSC),豪斯多夫距离95(HD95)和平均表面距离(AVD)分别为89.1%,1.76 mm和1.04 mm;在DSC指标上,与次优的MGANet(Meta Greyscale Adaptive Network)相比,MDAUnet提升了1.2个百分点;在HD95和ASD指标上,与次优的UNETR(UNEt TRansformers)相比,MDAUnet分别降低了0.87 mm和0.45 mm。可见MDAUnet能有效提高肾脏三维结构分割精度,有助于医生在临床手术中客观有效地评估病情。 展开更多
关键词 肾脏三维结构分割 注意模块 计算机断层血管造影 损失函数 边缘检测
在线阅读 下载PDF
注意力引导多任务学习的前列腺癌盆腔淋巴结转移预测
19
作者 张志远 胡冀苏 +3 位作者 张跃跃 钱旭升 周志勇 戴亚康 《上海交通大学学报》 北大核心 2025年第8期1216-1224,共9页
基于前列腺癌原发灶的术前磁共振影像定量特征预测盆腔淋巴结转移(PLNM)是治疗方案制定的重要参考依据.然而,现有预测方法对肿瘤原发灶内部的异质性信息提取不足,导致提取的图像定量特征与PLNM关联性较弱.针对这一问题,提出一种以肿瘤... 基于前列腺癌原发灶的术前磁共振影像定量特征预测盆腔淋巴结转移(PLNM)是治疗方案制定的重要参考依据.然而,现有预测方法对肿瘤原发灶内部的异质性信息提取不足,导致提取的图像定量特征与PLNM关联性较弱.针对这一问题,提出一种以肿瘤分割任务为辅助任务的注意力引导多任务学习网络用于PLNM预测.首先,在肿瘤分割网络中,提出多分支各向异性大核注意力模块,通过不同分支和各向异性大卷积核的融合扩大的感受野以有效捕获肿瘤的局部和全局信息.其次,在PLNM预测网络中,设计多尺度特征交互融合注意力模块,对多尺度特征进行层次化融合筛选.在320例数据集的实验中,所提方法的精度召回曲线下面积值和受试者操作特征曲线下面积值分别为(85.44±2.04)%和(91.86±2.18)%,优于经典的单任务分类方法和多任务方法. 展开更多
关键词 前列腺癌盆腔淋巴结转移 多任务学习 多分支各向异性大核注意模块 多尺度特征交互融合注意模块 多参数磁共振
在线阅读 下载PDF
基于多尺度注意力UNet++的地震层位识别方法
20
作者 杨润湉 马强 +3 位作者 王志宝 李菲 吴钧 王如意 《石油物探》 北大核心 2025年第2期315-327,共13页
现有基于深度学习的层位识别方法通常在地震振幅信号特征方面进行处理,而地层之间上、下位置的空间关系、不同尺度特征未得到充分关注,导致普通深度学习网络在识别多个地震层位时容易产生层位识别结果连续性不强和错层等问题。为了充分... 现有基于深度学习的层位识别方法通常在地震振幅信号特征方面进行处理,而地层之间上、下位置的空间关系、不同尺度特征未得到充分关注,导致普通深度学习网络在识别多个地震层位时容易产生层位识别结果连续性不强和错层等问题。为了充分利用层位之间的空间位置关系及多尺度特征,使用MultiResBlock多尺度残差模块、CBAM注意力与UNet++,提出了基于多尺度注意力UNet++的层位识别方法 (MR_CBAM_UNet++)。该方法利用MultiResBlock提取更多层位尺度特征,采用CBAM注意力模块以减少非目标层的振幅信号干扰,利用Focal Loss与Dice Loss组成的联合损失函数对网络进行训练。最后,加入唯一性约束对模型识别结果优化得到层位识别结果。在实际地震数据上的评价结果显示,MR_CBAM_UNet++模型相比于传统模型,对非层位信息的抑制能力和复杂地势下层位的识别能力均有很大提升。在测试集上,层位识别结果的准确率达到了86.19%,有效缓解了层位解释连续性不强和错层等问题,唯一性约束也使层位识别结果更贴近实际。 展开更多
关键词 地震层位解释 UNet++ CBAM注意模块 MultiResBlock多尺度残差模块 联合损失函数
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部