期刊文献+
共找到71篇文章
< 1 2 4 >
每页显示 20 50 100
结合结构重参数化方法与空间注意力机制的图像融合模型 被引量:10
1
作者 俞利新 崔祺 +3 位作者 车军 许悦雷 张凡 李帆 《计算机应用研究》 CSCD 北大核心 2022年第5期1573-1578,1600,共7页
针对深度学习在红外与可见光图像融合时无法同时满足运算效率和融合效果的问题,提出了一种无监督端到端的红外与可见光图像融合模型。该模型的图像特征提取模块采用结构重参数化方法,有效提升了算法的运行效率;同时引入了注意力机制,减... 针对深度学习在红外与可见光图像融合时无法同时满足运算效率和融合效果的问题,提出了一种无监督端到端的红外与可见光图像融合模型。该模型的图像特征提取模块采用结构重参数化方法,有效提升了算法的运行效率;同时引入了注意力机制,减小了冗余信息对融合结果的干扰;损失函数基于结构相似度设计。对比实验结果表明,该模型保证了融合效果并提升了运行速度,相比于不使用结构重参数化的方法,运行速度提升了34%。 展开更多
关键词 结构重参数化 端到端 空间注意力机制 无监督学习 结构相似度
在线阅读 下载PDF
结合空间注意力机制与光流特征的微表情识别方法 被引量:15
2
作者 刘德志 梁正友 孙宇 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第10期1541-1552,共12页
针对微表情运动的局部性问题,提出一种将深度学习的空间注意力机制与微表情光流特征相结合的微表情识别自动方法.首先,采用帧差法识别缺少峰值帧标记的微表情样本的峰值帧;然后,利用TV-L1光流法提取微表情起始帧与峰值帧之间的光流水平... 针对微表情运动的局部性问题,提出一种将深度学习的空间注意力机制与微表情光流特征相结合的微表情识别自动方法.首先,采用帧差法识别缺少峰值帧标记的微表情样本的峰值帧;然后,利用TV-L1光流法提取微表情起始帧与峰值帧之间的光流水平、垂直分量图,并根据光流的水平、垂直分量图导出对应的光流应变模式图;将3个光流图以通道叠加的方式连接起来,构成微表情的光流特征图;最后,在Inception模块搭建的卷积神经网络中设计了一种包含可学习参数的空间注意力单元,使模型在特征提取过程中能够更加关注存在微表情运动的区域.在空间注意力单元中利用3×3和7×7这2种大小的卷积核进行空间注意力的推断,使模型能够综合地考虑不同尺度卷积核的注意力推断结果.实验结果表明,该方法在MEGC2019综合微表情数据集上的识别准确率达到0.788,优于已有的微表情识别方法. 展开更多
关键词 微表情识别 深度学习 空间注意力机制 光流法 卷积神经网络 情绪分类
在线阅读 下载PDF
具有全局特征的空间注意力机制 被引量:11
3
作者 张连超 乔瑞萍 +2 位作者 党祺玮 翟沛源 孙红帅 《西安交通大学学报》 EI CAS CSCD 北大核心 2020年第11期129-138,共10页
为了获得卷积神经网络特征图中不同特征点之间的长距离依赖关系,使卷积神经网络更好地区分前景目标和背景信息,提出了一种具有全局特征的空间注意力机制。通过通道融合层将多通道的原始特征图组合成单通道的特征融合图,消除了通道间信... 为了获得卷积神经网络特征图中不同特征点之间的长距离依赖关系,使卷积神经网络更好地区分前景目标和背景信息,提出了一种具有全局特征的空间注意力机制。通过通道融合层将多通道的原始特征图组合成单通道的特征融合图,消除了通道间信息分布对获取空间注意力权重的影响;将特征融合图经过全局特征获取处理,获得能够反映特征融合图中某特征点与特征融合图中所有点之间相关性的全局特征图;全局特征图与初始值为0的可学习变量相乘,并且在通道域复制自身,扩展为原始特征图大小,将扩展后的全局特征图与原始特征图对应元素相加,获得具有注意力机制的特征图。在不同卷积神经网络中加入具有全局特征的空间注意力机制进行实验,结果表明:在脑电波二分类任务中,所提注意力机制的分类准确率最高提升了0.839%;在CIFAR-10数据集多分类任务中,所提注意力机制的分类准确率最高提升了0.484%;在夜间车辆单类别检测中,在交并比阈值大于0.5的平均精度评判标准下,所提注意力机制最高提升了3.860%,在交并比阈值大于0.75的平均精度评判标准下,所提注意力机制最高提升了11.726%;在voc2007数据集多类别检测中,在交并比阈值大于0.5的平均精度评判标准下,所提注意力机制最高提升了0.778%,在交并比阈值大于0.75的平均精度评判标准下,所提注意力机制最高提升了1.232%。 展开更多
关键词 卷积神经网络 空间注意力机制 全局特征 特征融合 目标分类 目标检测
在线阅读 下载PDF
基于空间注意力机制的行人再识别方法 被引量:1
4
作者 张子昊 周千里 王蓉 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2020年第9期1747-1755,共9页
行人再识别是图像检索领域的一个重要部分,但是由于行人姿态各异、背景复杂等因素,导致提取到的行人特征鲁棒性和代表性不强,进而影响行人再识别的精度。在AlignedReID++算法基础上,提出了基于空间注意力机制的行人特征提取方法,应用在... 行人再识别是图像检索领域的一个重要部分,但是由于行人姿态各异、背景复杂等因素,导致提取到的行人特征鲁棒性和代表性不强,进而影响行人再识别的精度。在AlignedReID++算法基础上,提出了基于空间注意力机制的行人特征提取方法,应用在行人再识别中取得了很好的效果。首先,在特征提取部分,引入空间注意力机制来增强特征表达,同时抑制可能的噪声;其次,通过在卷积层中引入实例正则化层(IN)来辅助批正则化层(BN)对特征进行归一化处理,解决单一BN层对特征色调变化以及光照变化的不敏感性,提高特征提取对亮度、色调变化的鲁棒性;最后,在Market1501、DukeMTMC和CUHK033个行人再识别通用数据集上对所提改进模型进行测试评价。实验结果显示:改进后的模型在3个数据集上识别精度分别提升了2%、2.9%和5.1%,表明改进后的模型相较于改进前的模型,在精度以及鲁棒性上都有显著提高。 展开更多
关键词 深度学习 空间注意力机制 行人特征 特征增强 卷积神经网络
在线阅读 下载PDF
结合空间注意力机制与多尺度分辨率融合的低光照图像增强方法 被引量:3
5
作者 王秀君 钱蓉蓉 任文平 《激光杂志》 CAS 北大核心 2023年第6期86-91,共6页
为了解决低光照条件下拍摄造成的对比度过低、颜色失真等多种图像内容退化问题,提出了一种结合空间注意力机制与多尺度分辨率融合的图像增强方法。首先基于Retinex理论,利用带有空间注意力机制的分解网络将低光照图像分解为光照图与反射... 为了解决低光照条件下拍摄造成的对比度过低、颜色失真等多种图像内容退化问题,提出了一种结合空间注意力机制与多尺度分辨率融合的图像增强方法。首先基于Retinex理论,利用带有空间注意力机制的分解网络将低光照图像分解为光照图与反射图,并且在光照图中,采用伽玛校正对光照图拉伸光照对比度。然后在融合网络中,将校正过的光照图与反射图通过U-net网络,使高、低分辨率的特征图充分融合来生成最终的色泽度饱满、细节信息丰富的结果。提出的算法在LOL-dataset数据集的结构相似度指标为0.8032,比同类最优算法高出6.37%。 展开更多
关键词 RETINEX理论 空间注意力机制 图像增强 伽玛校正 U-net网络
在线阅读 下载PDF
基于融合注意力机制LSTM网络的地下水位自适应鲁棒预测 被引量:5
6
作者 佃松宜 厉潇滢 +2 位作者 杨丹 芮胜阳 郭斌 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第1期54-64,共11页
地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问... 地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问题,本文提出了一种新的鲁棒自适应水位预测算法。首先,对水文数据进行预处理,解决了数据时间跨度大、噪声多、缺失及异常、非平稳等问题。其次,针对不同输入特征对预测指标的影响,在模型训练阶段提出一种新的空间变量注意机制,可快速识别与水位关联的关键变量,并对输入特征赋予不同的影响权重。然后,针对不同序列长度对预测效果的影响,还设计了自适应时间注意力机制,帮助网络自适应地找出与不同时间序列长度预测指标相关的编码器隐藏状态,以更好地捕捉时间上的依赖关系。在此基础上,以上下文向量作为输入,提出一种融合注意力机制的长短时记忆网络水文预测算法。最后,通过意大利Petrignano水文数据验证了所提算法的有效性,并与GRU、Elman、LSTM、VA–LSTM和S–LSTM等方法进行预测性能比较。结果表明,基于融合注意力机制的LSTM网络在面临大规模、噪点多的复杂数据时有优于其它几种算法的预测效果,表明该算法具有强自适应性和鲁棒性。本文研究结果可以为市政排水策略合理调整、及时控制提供参考。 展开更多
关键词 地下水位预测 时间与空间注意力机制 LSTM网络 自适应预测 鲁棒预测
在线阅读 下载PDF
采用空间和通道激励注意力机制优化ResNet-50的CFRP/TC4叠层材料钻削刀具磨损状态监测 被引量:1
7
作者 聂鹏 杨程越 +2 位作者 彭新月 于家鹤 潘五九 《中国机械工程》 EI CAS CSCD 北大核心 2024年第10期1793-1801,共9页
针对碳纤维增强复合材料(CFRP)与钛合金组成的叠层材料在制备装配孔时存在刀具磨损严重的问题,提出了一种空间和通道激励注意力机制(scSE)优化深度残差神经网络(ResNet-50)的刀具磨损监测方法。开展钻削实验,采集钻削过程中的力和温度信... 针对碳纤维增强复合材料(CFRP)与钛合金组成的叠层材料在制备装配孔时存在刀具磨损严重的问题,提出了一种空间和通道激励注意力机制(scSE)优化深度残差神经网络(ResNet-50)的刀具磨损监测方法。开展钻削实验,采集钻削过程中的力和温度信号,信号经连续小波变换转换为小波尺度谱。搭建ResNet-50网络结构,从空间和通道双维度对卷积提取的特征图进行权重标定。研究结果表明,scSE可以从空间和通道两个维度做到增强有用特征,抑制无用特征,经scSE优化的网络结构识别准确度达到96.15%。 展开更多
关键词 刀具磨损 连续小波变换 空间和通道激励注意力机制 深度残差神经网络
在线阅读 下载PDF
通道-空间联合注意力机制的显著性检测模型 被引量:9
8
作者 陈维婧 周萍 +2 位作者 杨海燕 杨青 陈睿 《计算机工程与应用》 CSCD 北大核心 2021年第19期214-219,共6页
针对显著性区域突出不均匀和边缘不清晰导致显著性检测鲁棒性差等问题,提出了一种通道-空间联合注意力机制的显著性检测模型。改进了一种通道注意力机制,将特征图中的像素概率值逐像素相加以更好的获取通道中层间信息的关联性;在通道注... 针对显著性区域突出不均匀和边缘不清晰导致显著性检测鲁棒性差等问题,提出了一种通道-空间联合注意力机制的显著性检测模型。改进了一种通道注意力机制,将特征图中的像素概率值逐像素相加以更好的获取通道中层间信息的关联性;在通道注意力机制的基础上并行融入了空间注意力机制,对特征图的空间信息进行加权获得目标突出的显著性区域;将通道注意力机制与空间注意力机制输出的两个特征图加权融合反馈至通道-空间联合注意力机制,从而得到细粒度更高的显著图。实验结果表明,该模型在公开的数据集DUTS-TE和SOD上,使用F-measure和平均绝对误差作为评估标准均优于其他同类模型。 展开更多
关键词 显著性检测 通道注意力机制 空间注意力机制
在线阅读 下载PDF
DenseNet结合空间通道注意力机制的环境声音分类 被引量:3
9
作者 董绍江 刘伟 《重庆理工大学学报(自然科学)》 北大核心 2023年第11期179-187,共9页
音乐信息识别(MIR)和自动语音识别(ASR)都是以结构化声音为特点的声音识别,环境声音识别在声音识别领域的难度很大。为了充分利用从环境声中提取的Log-Mel谱图的空间特征与通道特征,提出了一种基于密集连接卷积网络(DenseNet)的空间通... 音乐信息识别(MIR)和自动语音识别(ASR)都是以结构化声音为特点的声音识别,环境声音识别在声音识别领域的难度很大。为了充分利用从环境声中提取的Log-Mel谱图的空间特征与通道特征,提出了一种基于密集连接卷积网络(DenseNet)的空间通道注意力机制。使用DenseNet对Log-Mel谱图进行特征提取,引入空间通道注意力机制使网络更加关注显著特征;为了解决数据不足导致的过拟合问题,将混合数据增强的方法应用于Log-Mel谱图,从而保证了数据的多样性;在2个公共数据集(ESC-50和ESC-10)验证所提方法的有效性。结果表明:所提的空间通道注意力机制模型能够使神经网络对环境声音的识别率分别达到79.3%(ESC-50)和94.3%(ESC-10)。 展开更多
关键词 环境声音分类 空间通道注意力机制 密集连接卷积网络 混合数据增强
在线阅读 下载PDF
基于混合域残差注意力网络的滚动轴承智能故障诊断方法 被引量:3
10
作者 贾立新 陈永毅 +1 位作者 倪洪杰 张丹 《高技术通讯》 CAS 北大核心 2024年第1期101-110,共10页
机械设备正朝着大型化、精密化和自动化的方向发展,机械系统也因此变得越来越复杂。考虑到机械系统可能会发生无特征的灾难性故障,因此机械故障的自动检测是一个巨大的挑战。然而,现有的故障检测方法在对高度复杂的工业系统进行故障类... 机械设备正朝着大型化、精密化和自动化的方向发展,机械系统也因此变得越来越复杂。考虑到机械系统可能会发生无特征的灾难性故障,因此机械故障的自动检测是一个巨大的挑战。然而,现有的故障检测方法在对高度复杂的工业系统进行故障类型识别时,误诊率较高,无法给出准确的故障诊断结果。针对这一问题,本文以滚动轴承这一机械设备关键部件作为研究对象,提出一种基于混合域残差注意力网络的故障诊断方法,旨在结合深度卷积神经网络自动学习表示的优点,并配合通道注意力机制和空间注意力机制的关键特征提取能力,提高故障检测性能。实验结果表明,所提出的方法能够准确地检测轴承故障类型,在准确度指标方面优于其他方法。 展开更多
关键词 故障诊断 滚动轴承 通道注意力机制 空间注意力机制 卷积神经网络(CNN)
在线阅读 下载PDF
基于空间通道注意力机制与多尺度融合的交通标志识别研究 被引量:9
11
作者 黄志强 李军 《南京邮电大学学报(自然科学版)》 北大核心 2022年第2期93-102,共10页
通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图... 通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图的语义信息,将第19层卷积层通过上采样后与第7层卷积层相连接,多尺度融合后输入YOLO层形成新的特征金字塔,以此提高小目标的识别率。同时,为使网络更加关注交通标志的细节信息,在特征金字塔网络中增添能够增强前景信息降低背景信息的空间通道注意力机制。使用Kmeans聚类算法对数据集作聚类处理,获得一组先验框。在长沙理工大学交通标志数据集上进行测试,实验结果表明,改进后算法的识别率达到91.8%,与YOLOV3-tiny算法相比提高了24.9个百分点,而与YOLOV3算法相比,每张图片的检测时间降低至0.133s,降低了49.6%,该算法具有较强的实时性和准确性。 展开更多
关键词 交通标志 轻量化网络 YOLOV3-3ctiny 多尺度融合 特征金字塔 空间通道注意力机制
在线阅读 下载PDF
结合超轻量级双注意力模块的ShuffleNetV2面部表情识别 被引量:2
12
作者 林恩惠 王凡 谭晓玲 《电子测量技术》 北大核心 2024年第10期168-174,共7页
针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征... 针对面部表情识别领域中难以同时实现低参数量与高准确率的挑战,提出了一种结合注意力机制的ShuffleNetV2网络的面部表情识别方法。该方法基于ShuffleNetV2架构,通过微调模型将Relu激活函数替换为PRelu激活函数,进一步提升了模型的特征捕获与分类能力。此外,本文创新性地引入了一种超轻量级双注意力模块LDAM,该模块结合了DCAM注意力机制与空间注意力机制,并通过捷径连接技术集成到优化后的ShuffleNetV2模型中,以增强模型对细节特征的识别能力及分类效果。在FER2013和CK+两大公认的面部表情识别数据集上的实验结果显示,本方法分别达到了69.12%和94.77%的识别准确率,同时保持了低至1.25的模型参数量。这一成果不仅展示了在保持模型轻量化的同时提升识别性能的可能性,而且通过实验验证了所提出方法的高效性和实用性。 展开更多
关键词 面部表情识别方法的改进 激活函数 空间注意力机制 轻量化模型 超轻量级双注意力模块
在线阅读 下载PDF
基于光谱-空间注意力残差网络的高光谱图像分类 被引量:4
13
作者 汪菲菲 赵慧洁 +2 位作者 李娜 李思远 蔡昱 《光子学报》 EI CAS CSCD 北大核心 2023年第12期200-218,共19页
在高光谱图像分类任务中,引入注意力改变提取到的光谱和空间特征权重,有效突出重要特征,提高分类准确率。将注意力机制、残差网络和特征提取模块集成到分类框架中,引入中心区域光谱注意力机制,在避免干扰像素对波段权重影响的同时,利用... 在高光谱图像分类任务中,引入注意力改变提取到的光谱和空间特征权重,有效突出重要特征,提高分类准确率。将注意力机制、残差网络和特征提取模块集成到分类框架中,引入中心区域光谱注意力机制,在避免干扰像素对波段权重影响的同时,利用周围像素增强中心像素波段,增强光谱特征的鲁棒性进而提取有效的光谱特征。并在此基础上提出了光谱-空间注意力残差网络,该网络可以从高光谱图像中连续提取到丰富的光谱特征和空间特征,并通过残差网络连接特征提取模块,缓解了精度下降问题,保证网络良好的分类性能。在4个公开数据集上,所提出的分类算法和其他算法相比,各项指标均达到最优。 展开更多
关键词 光谱-空间特征 残差网络 高光谱分类 光谱注意力机制 空间注意力机制
在线阅读 下载PDF
Attention-YOLO:引入注意力机制的YOLO检测算法 被引量:80
14
作者 徐诚极 王晓峰 杨亚东 《计算机工程与应用》 CSCD 北大核心 2019年第6期13-23,125,共12页
实时目标检测算法YOLOv3的检测速度较快且精度良好,但存在边界框定位不够精确、难以区分重叠物体等不足。提出了Attention-YOLO算法,该算法借鉴了基于项的注意力机制,将通道注意力及空间注意力机制加入特征提取网络之中,使用经过筛选加... 实时目标检测算法YOLOv3的检测速度较快且精度良好,但存在边界框定位不够精确、难以区分重叠物体等不足。提出了Attention-YOLO算法,该算法借鉴了基于项的注意力机制,将通道注意力及空间注意力机制加入特征提取网络之中,使用经过筛选加权的特征向量来替换原有的特征向量进行残差融合,同时添加二阶项来减少融合过程中的信息损失并加速模型收敛。通过在COCO和PASCAL VOC数据集上的实验表明,该算法有效降低了边界框的定位误差并提升了检测精度。相比YOLOv3算法在COCO测试集上的mAP_(@IoU[0.5:0.95])提升了最高2.5 mAP,在PASCAL VOC 2007测试集上达到了最高81.9 mAP。 展开更多
关键词 目标检测 YOLOv3算法 Attention-YOLO算法 通道注意力机制 空间注意力机制
在线阅读 下载PDF
基于双重注意力机制的图像超分辨重建算法 被引量:15
15
作者 李彬 王平 赵思逸 《图学学报》 CSCD 北大核心 2021年第2期206-215,共10页
近年来,卷积神经网络(CNN)在单幅图像超分辨率重建领域(SISR)展现出良好效果。深度网络可以在低分辨率图像和高分辨率图像之间建立复杂的映射,使得重建图像质量相对传统的方法取得巨大提升。由于现有SISR方法通过加深和加宽网络结构以... 近年来,卷积神经网络(CNN)在单幅图像超分辨率重建领域(SISR)展现出良好效果。深度网络可以在低分辨率图像和高分辨率图像之间建立复杂的映射,使得重建图像质量相对传统的方法取得巨大提升。由于现有SISR方法通过加深和加宽网络结构以增大卷积核的感受野,在具有不同重要性的空间域和通道域采用均等处理的方法,因此会导致大量的计算资源浪费在不重要的特征上。为了解决此问题,算法通过双重注意力模块捕捉通道域与空间域隐含的权重信息,以更加高效的分配计算资源,加快网络收敛,在网络中通过残差连接融合全局特征,不仅使得主干网络可以集中学习图像丢失的高频信息流,同时可以通过有效的特征监督加快网络收敛,为缓解MAE损失函数存在的缺陷,在算法中引入了一种特殊的Huber loss函数。在主流数据集上的实验结果表明,该算法相对现有的SISR算法在图像重建精度上有了明显的提高。 展开更多
关键词 单幅图像超分辨 特征监督 残差连接 通道注意力机制 空间注意力机制
在线阅读 下载PDF
基于注意力机制的跨分辨率行人重识别 被引量:8
16
作者 廖华年 徐新 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期605-612,共8页
行人图像分辨率的变化对现有的行人重识别方法带来了很大的挑战。针对这一问题,提出了一种新的跨分辨率行人重识别方法。该方法从两方面解决分辨率变化带来的识别困难:一方面通过通道注意力机制和空间注意力机制捕捉人物特征获取局部区... 行人图像分辨率的变化对现有的行人重识别方法带来了很大的挑战。针对这一问题,提出了一种新的跨分辨率行人重识别方法。该方法从两方面解决分辨率变化带来的识别困难:一方面通过通道注意力机制和空间注意力机制捕捉人物特征获取局部区域;另一方面通过核动态上采样模块恢复任意分辨率图像的局部区域信息。为了验证所提方法的有效性,在Market1501、CUHK03和CAVIAR三个公开数据集上开展了对比实验,实验结果表明:所提方法取得了最佳性能。 展开更多
关键词 行人重识别 通道注意力机制 空间注意力机制 图像超分辨率 上采样
在线阅读 下载PDF
基于多尺度残差空间注意力轻量化U-Net的农业害虫检测方法 被引量:5
17
作者 李萍 刘裕 +1 位作者 师晓丽 张善文 《江苏农业科学》 北大核心 2023年第3期187-196,共10页
田间害虫的快速精准检测是作物害虫防治的前提。现有基于卷积神经网络的作物害虫检测方法常包含大量训练参数,难以应用于现实场景中。针对上述难点,提出1种基于多尺度残差空间注意力轻量化U-Net(Multi-scale residual spatial attention... 田间害虫的快速精准检测是作物害虫防治的前提。现有基于卷积神经网络的作物害虫检测方法常包含大量训练参数,难以应用于现实场景中。针对上述难点,提出1种基于多尺度残差空间注意力轻量化U-Net(Multi-scale residual spatial attention lightweight U-Net,简称MSRSALU-Net)的检测方法,并应用于田间害虫检测。MSRSALU-Net由编码模块与解码模块组成。在MSRSALU-Net编码模块中,多尺度残差卷积模块用于提取害虫多尺度信息以缓解害虫尺度变化对检测性能的影响;空间注意力机制模块用于提取特征的全局依赖以缓解复杂背景对检测性能的干扰。此外,使用残差连接路径模块连接MSRSALU-Net的编码模块与解码模块,以更好地传播特征信息。在构建的IP13数据库上进行试验,基于MSRSALU-Net的害虫检测方法的识别精度为95.11%。与基于UNet、注意力UNet、MultiResUNet的害虫检测方法相比,MSRSALU-Net检测精度分别提高11.85%、5.38%、2.41%。模型参数量与U-Net、注意力UNet、MultiResUNet相比,分别减少了25.81%、21.45%、18.39%。结果表明,提出的MSRSALU-Net能有效克服害虫尺度变化、背景复杂等因素干扰,实现害虫的快速精准识别。该方法可为田间作物害虫检测系统提供技术支撑。 展开更多
关键词 作物害虫检测 U-Net 空间注意力机制 多尺度残差空间注意力轻量化U-Net
在线阅读 下载PDF
基于注意力机制的端到端合成语音检测 被引量:6
18
作者 王锦阳 华光 黄双 《信号处理》 CSCD 北大核心 2022年第9期1975-1987,共13页
近年来深度伪造(Deepfake)技术的迅猛发展使合成语音的自然度和拟人度有了显著提升,对合成语音检测研究提出了更大挑战。本文将五种轻量级注意力模块中的机制改进为适用于语音序列的通道注意力机制和一维空间注意力机制,然后将模块分别... 近年来深度伪造(Deepfake)技术的迅猛发展使合成语音的自然度和拟人度有了显著提升,对合成语音检测研究提出了更大挑战。本文将五种轻量级注意力模块中的机制改进为适用于语音序列的通道注意力机制和一维空间注意力机制,然后将模块分别嵌入到Inc-TSSDNet网络中,提出基于注意力机制的端到端合成语音检测系统。结果表明,改进系统能够重点关注某些对于检测真伪更关键的通道或区域来提高检测性能,相比于基线模型,引入注意力机制的十种模型在增加的参数量较少的情况下,ASVspoof2019测试集的等错误率(Equal Error Rate,EER)和最小串联检测代价函数(Minimum Tandem Detection Cost Function,min t-DCF)都有所降低,其中在池化层之前嵌入CBAM(Convolutional Block Attention Module)的模型测试集EER最低且具有较强的泛化性,在池化层之前嵌入ECA(Efficient Channel Attention)模块的模型测试集min t-DCF最低且统计性能较基线模型有显著提升。 展开更多
关键词 合成语音检测 端到端 通道注意力机制 一维空间注意力机制
在线阅读 下载PDF
基于路侧相机的自适应空间变换车辆检测方法
19
作者 华家宝 张京瑞 +1 位作者 朱福民 陈璐 《计算机工程》 北大核心 2025年第6期349-359,共11页
为了提高基于路侧相机的车辆检测的准确性和效率,研究了融合卷积神经网络(CNN)与Transformer模型的车辆检测模型。针对复杂的交通场景,设计了自适应空间Transformer,将其与ResNet50结合构建了可以应对车辆视角和尺度变换的主干网络。设... 为了提高基于路侧相机的车辆检测的准确性和效率,研究了融合卷积神经网络(CNN)与Transformer模型的车辆检测模型。针对复杂的交通场景,设计了自适应空间Transformer,将其与ResNet50结合构建了可以应对车辆视角和尺度变换的主干网络。设计了基于角度和距离的位置编码,优化Transformer模型输入,使模型充分利用图像中的空间信息,并采用了通道空间注意力模块,以更好地捕获图像中的上下文信息。在解码器部分,去除了自回归机制,允许模型并行解码多个目标,并引入了目标查询集嵌入,使其更适应车辆检测任务。实验结果表明,所提模型在UA-DETRAC、IITM-hetra和自采数据集上的mAP@0.5分别达到96.42%、87.82%和98.64%,在所有尺寸上均超越了其他对比模型。消融实验进一步验证了各模块对性能的关键贡献。 展开更多
关键词 自适应空间变换 TRANSFORMER 车辆检测 通道空间注意力机制 路侧相机
在线阅读 下载PDF
混合扩张卷积和注意力机制的路面裂缝检测 被引量:6
20
作者 瞿中 李明 《计算机工程与设计》 北大核心 2023年第8期2425-2431,共7页
针对复杂背景下路面裂缝检测困难的问题,提出一种基于混合扩张卷积和空间-通道注意力机制的路面裂缝检测算法。基于改进的U-Net网络,在编码阶段,使用空间-通道注意力机制增强裂缝特征,抑制非裂缝特征;在网络中间部分,使用混合扩张卷积... 针对复杂背景下路面裂缝检测困难的问题,提出一种基于混合扩张卷积和空间-通道注意力机制的路面裂缝检测算法。基于改进的U-Net网络,在编码阶段,使用空间-通道注意力机制增强裂缝特征,抑制非裂缝特征;在网络中间部分,使用混合扩张卷积实现在不增加额外模块的前提下增大网络的感受野;在解码阶段,融合多层次和多尺度特征使最终预测结果更接近路面真实情况。实验结果表明,所提算法能够快速准确地对路面裂缝进行检测,具有较强的鲁棒性。 展开更多
关键词 裂缝检测 深度学习 卷积神经网络 编码-解码结构 混合扩张卷积 空间-通道注意力机制 多尺度特征融合
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部