期刊文献+
共找到430篇文章
< 1 2 22 >
每页显示 20 50 100
基于多维注意力模块的轻量化混凝土裂缝检测方法
1
作者 许华杰 郑力文 +1 位作者 张品 秦远卓 《计算机工程》 北大核心 2025年第5期351-360,共10页
为解决当前混凝土裂缝检测模型庞大难以部署到移动端设备且裂缝检测不准及漏检问题,提出一种基于多维注意力模块的轻量化混凝土裂缝检测方法。该方法针对当前主流的裂缝检测模型庞大的问题,采用深度可分离卷积对YOLOv5s中的CBS特征提取... 为解决当前混凝土裂缝检测模型庞大难以部署到移动端设备且裂缝检测不准及漏检问题,提出一种基于多维注意力模块的轻量化混凝土裂缝检测方法。该方法针对当前主流的裂缝检测模型庞大的问题,采用深度可分离卷积对YOLOv5s中的CBS特征提取模块进行重构,得到轻量化CBS(LCBS)特征提取模块,以减少网络的参数量及计算量;针对裂缝检测不准的问题,提出一种多尺度特征(MSF)提取模块用于替换YOLOv5s第1层的卷积层,以增强网络对不同尺寸裂缝特征的提取能力;针对裂缝漏检问题,提出融合空间及通道信息的多维注意力(MDA)模块,以增强裂缝特征提取能力和减少裂缝漏检。实验结果表明,所提方法比YOLOv5s参数量减少了35.2%,计算量减少了50.9%,模型规模减小了32.8%,且平均精度均值(mAP@0.5)提高了4.2百分点,与目前主流的同类目标检测方法相比,具有较低的参数量和较高的检测精度。 展开更多
关键词 裂缝检测 注意力模块 轻量化 YOLOv5s模型 目标检测
在线阅读 下载PDF
基于多层次瓶颈注意力模块的颅骨到面皮的生成方法
2
作者 王洁 姜文凯 +3 位作者 蒋佳琪 梁增磊 刘晓宁 耿国华 《西北大学学报(自然科学版)》 北大核心 2025年第1期201-212,共12页
从未知颅骨恢复其生前面貌是考古学、法医学和刑侦学重要的研究方向。现有的计算机三维辅助复原过程繁琐,耗时长,该研究针对现有模型在颅骨到面皮(不含纹理、头发等的面貌)图像生成上存在失真、扭曲、不平滑等现象,提出一种结合生成对... 从未知颅骨恢复其生前面貌是考古学、法医学和刑侦学重要的研究方向。现有的计算机三维辅助复原过程繁琐,耗时长,该研究针对现有模型在颅骨到面皮(不含纹理、头发等的面貌)图像生成上存在失真、扭曲、不平滑等现象,提出一种结合生成对抗网络和多层次瓶颈注意力模块的颅骨到面皮图像生成方法。该方法的生成器由6层AdaResBlock和瓶颈注意力模块组成,从通道和空间两个维度引导生成器关注更重要的区域,并根据特征自适应地调整归一化方式。同时,针对生成器模型较大的问题,引入蓝图可分离卷积减小其体积。此外,将判别器分为两部分,前几层被用来进行编码,取消传统网络中的单独编码器模块,使模型更紧凑;后几层则采用多尺度判别策略,从不同层级对图像进行分类判别,增强其准确性。实验结果表明,在颅骨到面皮图像生成任务上,该方法生成的面皮图像质量高于现有的其他方法,在视觉质量和图像质量上都取得了最高的分数,复原效果更加真实,图像定量评价指标PSNR、SSIM平均提升1.115,0.017,LPIPS平均降低0.026,面皮平均相似度为0.855。 展开更多
关键词 颅面生成 生成对抗网络 图像转换 瓶颈注意力模块 蓝图可分离卷积
在线阅读 下载PDF
基于混合注意力模块改进StarGAN的水下图像增强
3
作者 郑浩君 王振 +4 位作者 张佳鹏 刘胜男 钱程 涂雪滢 刘世晶 《南方水产科学》 北大核心 2025年第1期185-196,共12页
围绕水下图像色偏和模糊的特点,针对不同浑浊度的水下图像差异较大问题,提出了一种基于混合注意力模块(Convolutional block attention module,CBAM)改进的星型生成对抗网络(Star generative adversarial networks,StarGAN)用于水下多... 围绕水下图像色偏和模糊的特点,针对不同浑浊度的水下图像差异较大问题,提出了一种基于混合注意力模块(Convolutional block attention module,CBAM)改进的星型生成对抗网络(Star generative adversarial networks,StarGAN)用于水下多浑浊图像增强。首先使用水下相机采集实验室和养殖平台环境2组水下多浊度图像数据集;其次优化StarGAN,在每个ResidualBlock模块后引入一个由通道注意力模块和空间注意力模块串联组成的CBAM;最后进行消融实验,并与其他方法比较,使用水下图像质量评估(Underwater image quality measurement,UIQM)、水下彩色图像质量评估(Underwater color image quality evaluation,UCIQE)和图像熵作为图像质量评价指标。结果表明,实验室数据集增强后,UIQM达到1.18,UCIQE达到30.13,图像熵达到12.83;养殖平台数据集增强后,UIQM达到0.52,UCIQE达到10.35,图像熵达到9.94。该方法对实验室和养殖平台环境中不同浑浊度的图像增强均有较好的效果,在消融实验及与其他方法的比较中,该方法的得分均为最高。 展开更多
关键词 多浑浊度图像 水下图像增强 注意力模块 星型生成对抗网络
在线阅读 下载PDF
基于DenseNet和卷积注意力模块的高精度手势识别 被引量:5
4
作者 赵雅琴 宋雨晴 +3 位作者 吴晗 何胜阳 刘璞秋 吴龙文 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期967-976,共10页
非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷... 非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷达的微动手势识别方法。采用4片AWR1243雷达板级联而成的毫米波级联(MMWCAS)雷达采集手势回波,对手势回波进行时频分析,基于距离-多普勒(RD)图和3D点云检测出人手目标。通过数据预处理,提取手势目标的距离-时间谱图(RTM)、多普勒-时间谱图(DTM)、方位角-时间谱图(ATM)和俯仰角-时间谱图(ETM),更加全面地表征手势的运动特征,并形成混合特征谱图(FTM),对12种微动手势进行识别。设计了基于DenseNet和卷积注意力模块的手势识别网络,将混合特征谱图作为网络的输入,创新性地融合了卷积注意力模块(CBAM),实验表明,识别准确率达到99.03%,且该网络将注意力放在手势动作的前半段,实现了高精度的手势识别。 展开更多
关键词 手势识别 毫米波雷达 卷积神经网络 卷积注意力模块
在线阅读 下载PDF
基于特征相似性和特征规范化的注意力模块 被引量:1
5
作者 杜启亮 汪益民 田联房 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第7期62-71,共10页
近年来,注意力机制在图像分类、目标检测和语义分割等领域取得了巨大成功,但现有的注意力机制大多只能在通道或空间维度上实现特征融合,这极大限制了其在通道和空间维度上变化的灵活性,导致无法充分利用特征信息。为此,文中提出一种基... 近年来,注意力机制在图像分类、目标检测和语义分割等领域取得了巨大成功,但现有的注意力机制大多只能在通道或空间维度上实现特征融合,这极大限制了其在通道和空间维度上变化的灵活性,导致无法充分利用特征信息。为此,文中提出一种基于特征相似性和特征规范化的、可同时利用特征图各维度信息的卷积神经网络注意力模块FSNAM。该模块由特征相似性模块(FSM)和特征规范化模块(FNM)两部分组成,FSM利用输入特征图的通道特征信息和局部空间特征信息生成一个二维的特征相似性权重图;FNM利用输入特征图的全局空间特征信息生成一个三维的特征规范化权重图;两个模块生成的权重图融合在一起,生成一个三维的注意力权重图,以此实现通道特征信息和空间特征信息的融合。为证明FSNAM的可行性和有效性,进行了消融实验,结果表明:在图像分类任务方面,FSNAM模块对分类网络在CIFAR数据集上的性能提升明显优于其他主流注意力模块;在目标检测任务方面,使用FSNAM模块的目标检测网络对VOC数据集中的小目标和中等大小目标的检测准确率分别提高了3.9和1.2个百分点;在语义分割任务方面,使用FSNAM模块可以提高HRNet模型的性能,在SBD数据集上模型的平均像素准确率提高了0.58个百分点。 展开更多
关键词 卷积神经网络 计算机视觉 特征相似性 特征规范化 注意力模块
在线阅读 下载PDF
基于梯度可感知通道注意力模块的红外小目标检测前去噪网络 被引量:4
6
作者 林再平 罗伊杭 +5 位作者 李博扬 凌强 郑晴 杨晶贻 刘丽 吴京 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2024年第2期254-260,共7页
红外图像去噪在军事及民用领域应用广泛。现有基于深度学习的图像去噪方法主要为可见光图像设计,此类方法容易过度平滑图像细节,从而导致弱小目标丢失,为后续的检测任务带来困难。为了在去除噪声的同时保留好红外图像中的目标信息,本文... 红外图像去噪在军事及民用领域应用广泛。现有基于深度学习的图像去噪方法主要为可见光图像设计,此类方法容易过度平滑图像细节,从而导致弱小目标丢失,为后续的检测任务带来困难。为了在去除噪声的同时保留好红外图像中的目标信息,本文提出了一种基于梯度可感知通道注意力模块的红外弱小目标检测前去噪网络。该网络首先采用编码器-解码器结构来去除图像中的加性噪声,然后通过梯度可感知通道注意力模块对图像高频区域进行自适应增强,有效保持红外弱小目标的响应强度。此外,本文提出了领域第一个包含3981张含噪声的红外图像数据集。实验结果表明,该网络能够在有效去除加性噪声的同时避免过度平滑,很好地保留了红外图像中的目标信息,最终实现了在含噪声环境下的高鲁棒性红外弱小目标检测。 展开更多
关键词 红外小目标 检测前去噪 梯度可感知通道注意力模块
在线阅读 下载PDF
基于注意力模块的移动设备多场景持续身份认证 被引量:3
7
作者 金瑜瑶 张晓梅 王亚杰 《计算机工程与应用》 CSCD 北大核心 2024年第3期280-291,共12页
针对用户与移动设备交互时会产生场景变化,现有工作中只能采集特定的单一场景特征,无法实现多场景转换认证,并且身份认证准确率较低的问题,提出了一种基于移动模式的、注意力模块和卷积神经网络融合(CNNSACA)的多场景持续认证方案。在... 针对用户与移动设备交互时会产生场景变化,现有工作中只能采集特定的单一场景特征,无法实现多场景转换认证,并且身份认证准确率较低的问题,提出了一种基于移动模式的、注意力模块和卷积神经网络融合(CNNSACA)的多场景持续认证方案。在不限使用场景和操作的情况下,提取用户与移动设备交互时的移动模式(movement patterns,MP)特征,捕捉在动态和静态场景下产生的手部微运动,从而实现多场景的身份认证。设计并使用了一个包括五层卷积层结构的卷积神经网络,在第一层卷积后按序通过改进的空间和通道注意力子模块,再在多层卷积后进行反序分配权重,从两个维度来对通过卷积后所表征的MP特征分配双重注意力权重,增强关键特征表达。利用公开数据集验证所提方案在多场景身份认证方面的有效性和可行性。实验结果表明,所提出的基于移动模式的深度学习模型可以较好地解决身份认证场景单一的局限性,多场景的身份认证的准确率达到99.6%;同时,所提出的CNN-SACA模型与单独的CNN模型相比准确率提高了1.5个百分点,有效改善多场景下的移动设备身份认证能力。 展开更多
关键词 卷积神经网络 注意力模块 多场景 持续身份认证 移动设备
在线阅读 下载PDF
基于密集多尺度特征和双注意力模块的皮肤病变分割 被引量:2
8
作者 费承 罗健旭 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期97-105,共9页
针对皮肤病变分割任务中病变区域大小不一、形状各异、内部像素差异大、边界模糊、周围存在气泡等问题,提出了一种基于密集多尺度特征和双注意力模块的U型分割网络DDAnet。该网络中的DenseASPP模块通过密集连接多个空洞卷积层来获取丰... 针对皮肤病变分割任务中病变区域大小不一、形状各异、内部像素差异大、边界模糊、周围存在气泡等问题,提出了一种基于密集多尺度特征和双注意力模块的U型分割网络DDAnet。该网络中的DenseASPP模块通过密集连接多个空洞卷积层来获取丰富的多尺度信息,同时由通道注意力模块(CAM)和位置注意力模块(PAM)构成的双注意力模块通过编码全局上下文信息,在通道和位置上对特征图进行重新配准,实现对相关特征的强调和对无关特征的抑制。两个模块并行连接、共同作用以提高分割精度。在ISIC2018数据集上,DDAnet的准确率(Acc)、Jaccard相似系数(JI)、Dice系数(DC)、敏感度(Sen)和特异性(Spec)指标值分别为96.75%、85.00%、91.36%、91.82%和97.42%,分割结果优于其他的分割网络,并且对于极具挑战的病例,DDAnet仍然能够产生准确、可靠的分割结果,说明其具备在临床诊断中辅助医生进行皮肤病变分割的潜力。 展开更多
关键词 皮肤病变分割 DenseASPP模块 CAM PAM 注意力模块
在线阅读 下载PDF
融合监督注意力模块和跨阶段特征融合的图像修复改进网络 被引量:2
9
作者 黄巧玲 郑伯川 +1 位作者 丁梓成 吴泽东 《计算机应用》 CSCD 北大核心 2024年第2期572-579,共8页
非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两... 非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两阶段网络模型上,引入了SAM与CSFF模块。SAM通过提供真实图像监督信号,监督上阶段输出特征,确保传入下阶段特征信息的有效性。CSFF将上阶段编码器-解码器的特征融合后送入下阶段的编码器,以弥补上阶段修复中特征信息的损失。实验结果表明,在缺失区域占比为1%~10%时,相较于基线模型Gconv,Gconv_CS在CelebA-HQ数据集上峰值信噪比(PSNR)和结构相似性指数(SSIM)分别提高了1.5%和0.5%,Fréchet起始距离(FID)和L1损失分别降低了21.8%、14.8%;在Place2数据集上,前2个指标分别提高了26.7%和0.8%,后2个指标分别降低了7.9%、37.9%。将Gconv_CS用于去除大熊猫面部遮挡物时,取得了较好的修复视觉效果。 展开更多
关键词 图像修复 两阶段网络 跨阶段特征融合 监督注意力模块 门控卷积
在线阅读 下载PDF
结合超轻量级双注意力模块的ShuffleNetV2面部表情识别 被引量:1
10
作者 林恩惠 王凡 谭晓玲 《电子测量技术》 北大核心 2024年第10期168-174,共7页
针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征... 针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征捕获与分类能力。此外,本文创新性地引入了一种超轻量级双注意力模块LDAM,该模块结合了DCAM注意力机制与空间注意力机制,并通过捷径连接技术集成到优化后的ShuffleNetV2模型中,以增强模型对细节特征的识别能力及分类效果。在FER2013和CK+两大公认的面部表情识别数据集上的实验结果显示,本方法分别达到了69.12%和94.77%的识别准确率,同时保持了低至1.25的模型参数量。这一成果不仅展示了在保持模型轻量化的同时提升识别性能的可能性,而且通过实验验证了所提出方法的高效性和实用性。 展开更多
关键词 面部表情识别方法的改进 激活函数 空间注意力机制 轻量化模型 超轻量级双注意力模块
在线阅读 下载PDF
基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型
11
作者 孔哲 李寒 +5 位作者 甘少伟 孔明茹 何冰涛 郭子钰 金督程 邱兆文 《计算机应用》 CSCD 北大核心 2024年第7期2216-2224,共9页
针对肾脏结构中,因不同结构间差异大,动静脉体积小、结构薄及计算机断层扫描血管造影(CTA)图像灰度分布不均和伪影带来的精确分割困难的问题,提出基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型MDAUnet(MultiDecoder-Attent... 针对肾脏结构中,因不同结构间差异大,动静脉体积小、结构薄及计算机断层扫描血管造影(CTA)图像灰度分布不均和伪影带来的精确分割困难的问题,提出基于非对称多解码器和注意力模块的三维肾脏影像结构分割模型MDAUnet(MultiDecoder-Attention-Unet)。首先,针对不同结构间差异大导致网络无法共享权重的问题,采用多解码器结构,为语义结构不同的特征结构匹配不同的解码器分支;其次,针对血管体积小、结构薄难分割的问题,引入非对称的空间通道联合注意力模块使模型更关注管状结构,并对学习到的特征信息同时进行空间维度和通道维度的校准;最后,为了保证模型在反向传播中对血管结构有足够的关注,提出改进的加权硬区域适应损失(WHRA)作为损失函数来动态保持训练过程中血管结构的类间平衡以及保留背景信息的特征;此外,为了提高特征图灰度值的对比度,将传统图像处理边缘检测算子嵌入模型的预处理阶段,对待分割的感兴趣区域边界进行特征增强使模型更关注边界信息并抑制伪影信息。实验结果表明:所提出的MDAUnet模型在肾脏结构分割任务上的Dice相似系数(DSC),豪斯多夫距离95(HD95)和平均表面距离(AVD)分别为89.1%,1.76 mm和1.04 mm;在DSC指标上,与次优的MGANet(Meta Greyscale Adaptive Network)相比,MDAUnet提升了1.2个百分点;在HD95和ASD指标上,与次优的UNETR(UNEt TRansformers)相比,MDAUnet分别降低了0.87 mm和0.45 mm。可见MDAUnet能有效提高肾脏三维结构分割精度,有助于医生在临床手术中客观有效地评估病情。 展开更多
关键词 肾脏三维结构分割 注意力模块 计算机断层血管造影 损失函数 边缘检测
在线阅读 下载PDF
基于全卷积去噪自编码器与卷积块注意力模块的非侵入式居民负荷分解模型
12
作者 林顺富 李毅 +2 位作者 沈运帷 林屹峰 李东东 《电力自动化设备》 EI CSCD 北大核心 2024年第3期127-133,共7页
为了进一步提高低频居民负荷分解模型的分解精度与泛化能力,提出一种基于全卷积去噪自编码器与卷积块注意力模块的非侵入式居民负荷分解模型,该模型能够深度解析单一电器的功率曲线。基于全卷积去噪自编码器分别构建主回归子任务网络和... 为了进一步提高低频居民负荷分解模型的分解精度与泛化能力,提出一种基于全卷积去噪自编码器与卷积块注意力模块的非侵入式居民负荷分解模型,该模型能够深度解析单一电器的功率曲线。基于全卷积去噪自编码器分别构建主回归子任务网络和辅助分类子任务网络;在子任务网络中,通过引入卷积块注意力模块自适应分配特征注意力权重,以减小不重要因素在模型训练过程中的影响;将辅助分类子任务网络的输出作为主回归子任务网络输出的门控单元,实现最终的负荷分解。基于公开数据集的算例结果表明,所提负荷分解模型比现有负荷分解模型具有更优的分解精度和泛化能力。 展开更多
关键词 负荷分解 全卷积去噪自编码器 注意力模块 子任务网络 门控单元
在线阅读 下载PDF
基于卷积注意力模块的端到端遥感图像分类 被引量:10
13
作者 徐风 苗哲 业巧林 《林业工程学报》 CSCD 北大核心 2020年第4期133-138,共6页
随着图像信息处理技术的发展,大量由各式飞行器对地观测所采集的遥感图像数据被应用于各领域实际生产生活中。传统遥感图像分类方法包含一系列复杂的处理流程,在处理效率和效果上已经难以满足当下的需求。随着人工智能相关技术的发展,... 随着图像信息处理技术的发展,大量由各式飞行器对地观测所采集的遥感图像数据被应用于各领域实际生产生活中。传统遥感图像分类方法包含一系列复杂的处理流程,在处理效率和效果上已经难以满足当下的需求。随着人工智能相关技术的发展,基于卷积神经网络的遥感图像分类方法开始占据主导地位。为减少算法流程中的复杂处理与提高分类的精度,笔者提出一种基于卷积注意力模块的端到端遥感图像分类框架,该框架采用卷积神经网络框架ResNet101作为整个框架的主干网络。在ResNet101网络4个阶段的卷积模块之间嵌入卷积注意力模块,使得模型关注于最具有类别区分度的区域,从而得到更好的分类结果。在模型训练阶段,采用开源的深度学习开源框架Pytorch对训练数据进行在线增广处理,对训练数据进行随机角度旋转,防止训练过程中发生过拟合现象。本研究基于PatternNet与NWPU-RESISC45两个公开数据集,并仅划分少量数据用于模型训练。结果表明:相比已有的方法,本研究提出的框架能够在GPU加速的环境中,以更高的精度分类遥感图像,满足了实时处理的需求,且支持端到端对遥感图像进行分类,不需要复杂的处理流程。 展开更多
关键词 卷积神经网络 遥感图像 卷积注意力模块 图像分类
在线阅读 下载PDF
基于多级特征融合与注意力模块的场景识别方法 被引量:1
14
作者 许华杰 秦远卓 杨洋 《计算机科学》 CSCD 北大核心 2022年第4期209-214,共6页
场景图像通常由背景信息和前景目标对象构成,用于场景识别任务的卷积神经网络(CNN)通常需要根据场景中关键目标的特征,甚至结合目标之间的位置关系来识别出场景所属类别。针对场景图像中较小尺寸的关键目标特征随着网络层次的加深而逐... 场景图像通常由背景信息和前景目标对象构成,用于场景识别任务的卷积神经网络(CNN)通常需要根据场景中关键目标的特征,甚至结合目标之间的位置关系来识别出场景所属类别。针对场景图像中较小尺寸的关键目标特征随着网络层次的加深而逐渐消失,从而导致场景识别错误的问题,提出了一种基于多级特征融合与注意力模块的场景识别方法。首先,将深度神经网络ResNet-18的特征提取部分划分出5个分支;然后,将5个分支输出的多级特征进行融合,利用融合后的特征进行场景识别和分类,以弥补丢失的目标信息;最后,在网络中加入改进的注意力模块,以达到着重学习场景图像中关键目标的目的,进一步提升识别效果。在多个场景数据集上进行实验对比,结果表明,所提方法在MIT-67,SUN-397和UIUC-Sports这3个场景数据集上的识别准确率分别达到了88.2%,79.9%和97.7%,相比目前主流的场景识别方法其具有更高的识别准确率。 展开更多
关键词 场景识别 卷积神经网络 特征融合 注意力模块
在线阅读 下载PDF
基于分组注意力模块的实时农作物病害叶片语义分割模型 被引量:19
15
作者 钟昌源 胡泽林 +3 位作者 李淼 李华龙 杨选将 刘飞 《农业工程学报》 EI CAS CSCD 北大核心 2021年第4期208-215,共8页
针对传统农作物病害识别方法准确率低、鲁棒性差等问题,该研究首先提出一种基于分组激活策略的分组注意力模块,利用高阶特征指导加强低阶特征,通过分组计算组内加强系数,减少不同组之间的抑制作用,加强特征表达能力。对比试验表明,分组... 针对传统农作物病害识别方法准确率低、鲁棒性差等问题,该研究首先提出一种基于分组激活策略的分组注意力模块,利用高阶特征指导加强低阶特征,通过分组计算组内加强系数,减少不同组之间的抑制作用,加强特征表达能力。对比试验表明,分组注意力模块特征强化效果优于传统注意力模块。基于分组注意力模块,该研究提出一种实时高效农作物病害叶片语义分割模型,该模型融合了编码-解码语义分割模型和多流语义分割模型的优点。采用ResNet18模型作为特征提取网络对农作物病害叶片的语义分割像素精度达到93.9%,平均交并比达到78.6%。在单张NVIDIA GTX1080Ti显卡的硬件环境下,输入分辨率为900×600像素的图片,该模型运行速度达到每秒130.1帧,满足实时农作物病害叶片语义分割需求,为现代农业病害识别、自动施肥和精准灌溉等应用提供参考。 展开更多
关键词 病害 模型 图像识别 注意力模块 迁移学习 语义分割
在线阅读 下载PDF
基于卷积注意力模块和双通道网络的微表情识别算法 被引量:15
16
作者 牛瑞华 杨俊 +1 位作者 邢斓馨 吴仁彪 《计算机应用》 CSCD 北大核心 2021年第9期2552-2559,共8页
微表情是一种人类在试图隐藏自己真实情感时作出的面部动作,具有持续时间短、幅度小的典型特点。针对微表情识别难度大、识别效果不理想的问题,提出一种基于卷积注意力模块(CBAM)和双通道网络(DPN)的微表情识别算法——CBAM-DPN。首先,... 微表情是一种人类在试图隐藏自己真实情感时作出的面部动作,具有持续时间短、幅度小的典型特点。针对微表情识别难度大、识别效果不理想的问题,提出一种基于卷积注意力模块(CBAM)和双通道网络(DPN)的微表情识别算法——CBAM-DPN。首先,进行典型微表情数据集的数据融合;然后,分析序列帧中像素的变化值以确定顶点帧位置,再对顶点帧进行图像增强处理;最后,基于CBAM-DPN对图像增强后的微表情顶点帧进行特征的有效提取,并构建分类器对微表情进行识别。优化后模型的未加权F1值(UF1)和未加权平均召回率(UAR)分别可以达到0.7203和0.7293,相较于DPN模型分别提高了0.0489和0.0379,相较于CapsuleNet模型分别提高了0.0683和0.0787。实验结果表明,CBAM-DPN算法融合了CBAM和DPN的共同优势,可增强微小特征的信息提取能力,有效改善微表情识别性能。 展开更多
关键词 微表情识别 双通道网络 卷积注意力模块 顶点帧 结构优化
在线阅读 下载PDF
结合跨尺度特征融合与瓶颈注意力模块的轻量型红外小目标检测网络 被引量:9
17
作者 林再平 李博扬 +6 位作者 李淼 王龙光 吴天昊 罗伊杭 肖超 李若敬 安玮 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2022年第6期1102-1112,共11页
提出一种结合跨尺度特征融合与瓶颈注意力模块的轻量型单帧红外小目标检测网络。该网络在不引入额外神经元的前提下,直接在编码层和解码层之间进行高频多尺度特征交互,从而维持小目标在网络深层的响应幅值,实现小目标浅层空间结构特征... 提出一种结合跨尺度特征融合与瓶颈注意力模块的轻量型单帧红外小目标检测网络。该网络在不引入额外神经元的前提下,直接在编码层和解码层之间进行高频多尺度特征交互,从而维持小目标在网络深层的响应幅值,实现小目标浅层空间结构特征与深层高级语义特征之间的交互融合。同时,该网络在编码器瓶颈处级联轻量型混合注意力模块,进一步增强目标特征在网络深层的响应幅值。实验结果表明,该网络能有效抑制复杂背景杂波,并以较低参数量实现红外小目标检测。 展开更多
关键词 红外小目标检测 轻量型算法 跨尺度融合 瓶颈注意力模块
在线阅读 下载PDF
基于轻量级注意力模块的多人姿态估计 被引量:1
18
作者 杨竣乔 钱锋 唐漾 《控制工程》 CSCD 北大核心 2023年第9期1743-1750,共8页
为了提高人体姿态估计的检测精度,特别是中小尺寸人体关键点的检测精度,同时针对模块集成造成网络参数量和浮点计算量大幅度增加的问题,以HRNet(high-resolution Net)为基本网络架构,提出了一种基于轻量级注意力模块的分阶段网络(Coarse... 为了提高人体姿态估计的检测精度,特别是中小尺寸人体关键点的检测精度,同时针对模块集成造成网络参数量和浮点计算量大幅度增加的问题,以HRNet(high-resolution Net)为基本网络架构,提出了一种基于轻量级注意力模块的分阶段网络(Coarse-Refine Net,CRNet),采用知识蒸馏方法,利用同构的高精度网络作为教师网络,利用关键点的真值和教师网络的输出结果共同训练学生网络(CRNet)。通过在2017COCOval集上进行训练和测试,CRNet获得了78.2的得分(%),比HRNet基准模型提高了1.5%。对于中小尺寸人体关键点的检测,CRNet获得了74.8的得分(%),比HRNet基准模型提高了1.6%。在相似的网络结构下,CRNet相比于HRNet,网络参数量仅增加了0.1M(0.3%),浮点计算量仅增加了0.1G(0.6%)。与现阶段的最新方法相比,CRNet获得了更高的检测精度,同时基本没有增加网络参数量和浮点计算量。 展开更多
关键词 人体姿态估计 轻量级 注意力模块 知识蒸馏
在线阅读 下载PDF
基于卷积注意力模块和无锚框检测网络的行人跟踪算法 被引量:9
19
作者 张红颖 贺鹏艺 《电子与信息学报》 EI CSCD 北大核心 2022年第9期3299-3307,共9页
针对多目标跟踪过程中遮挡严重时的目标身份切换、跟踪轨迹中断等问题,该文提出一种基于卷积注意力模块(CBAM)和无锚框(anchor-free)检测网络的行人跟踪算法。首先,在高分辨率特征提取网络HrnetV2的基础上,对stem阶段引入注意力机制,以... 针对多目标跟踪过程中遮挡严重时的目标身份切换、跟踪轨迹中断等问题,该文提出一种基于卷积注意力模块(CBAM)和无锚框(anchor-free)检测网络的行人跟踪算法。首先,在高分辨率特征提取网络HrnetV2的基础上,对stem阶段引入注意力机制,以提取更具表达力的特征,从而加强对重识别分支的训练;其次,为了提高算法的运算速度,使检测和重识别分支共享特征权重且并行运行,同时减少头网络的卷积通道数以降低参数运算量;最后,设定合适的参数对网络进行充分的训练,并使用多个测试集对算法进行测试。实验结果表明,该文算法相较于FairMOT在2DMOT15,MOT17,MOT20数据集上的精确度分别提升1.1%,1.1%,0.2%,速度分别提升0.82,0.88,0.41 fps;相较于其他几种主流算法拥有最少的目标身份切换次数。该文算法能够更好地适用于遮挡严重的场景,实时性也有所提高。 展开更多
关键词 目标身份切换 高分辨率特征提取网络 卷积注意力模块 无锚框检测网络 头网络 FairMOT
在线阅读 下载PDF
基于空洞卷积与注意力模块的立体匹配算法 被引量:3
20
作者 刘志浩 孟凡云 +1 位作者 王金鹤 张楠 《计算机工程》 CAS CSCD 北大核心 2023年第8期223-231,共9页
基于卷积神经网络的立体匹配算法大多需要较大的感受野,但多数算法在扩大感受野的同时参数量也容易剧增,导致算法对训练数据的规模要求较高。提出一种基于空洞卷积和注意力模块的立体匹配算法,采用空洞卷积模块,将残差结构和空洞卷积相... 基于卷积神经网络的立体匹配算法大多需要较大的感受野,但多数算法在扩大感受野的同时参数量也容易剧增,导致算法对训练数据的规模要求较高。提出一种基于空洞卷积和注意力模块的立体匹配算法,采用空洞卷积模块,将残差结构和空洞卷积相结合,以在较少参数量的情况下扩大网络的感受野。使用注意力模块,通过不同层次的卷积整合多层次的信息,增加所提取信息的完整性。采用空间金字塔池化模块,通过帯权的金字塔池化扩大模型的感受野,并赋予不同层次信息不同的重要性程度。实验结果表明,在相同数据集和训练次数的情况下,所提算法相对于DispNetC等其他算法具有较快的收敛速度,且结构简单,参数量较少,适用于小样本数据。 展开更多
关键词 立体匹配 小样本数据 空洞卷积 注意力模块 金字塔池化
在线阅读 下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部