期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于空间金字塔注意力机制残差网络的高光谱图像分类
1
作者 刘和 宋璎珞 +3 位作者 胡龙湘 刘国辉 王侃 王爱丽 《液晶与显示》 CAS CSCD 北大核心 2024年第6期833-843,共11页
为了提取高光谱图像的空间-光谱联合特征,本文提出了一种基于改进的空间金字塔注意力机制残差网络的高光谱图像分类模型。首先采用主成分分析法去除光谱冗余,结合空间金字塔注意力机制,改进残差网络的高光谱图像分类模型获取精细化特征... 为了提取高光谱图像的空间-光谱联合特征,本文提出了一种基于改进的空间金字塔注意力机制残差网络的高光谱图像分类模型。首先采用主成分分析法去除光谱冗余,结合空间金字塔注意力机制,改进残差网络的高光谱图像分类模型获取精细化特征。然后利用空间金字塔注意力模型实现多尺度联合特征关注,提升对联合特征的敏感性,并有效地强调并聚焦空间和光谱信息,实现信息交互。最后经过Softmax分类器获得分类标签。本文提出的方法在MUUFL和Tento数据集上进行了实验,结果表明,本文算法的总体分类精度分别达到了94.08%和98.32%。相比于其他高光谱分类模型,本文模型的收敛速度较快,在分类性能上取得了明显的提升,获得了更高的地物分类精度。 展开更多
关键词 高光谱 图像分类 注意力机制 空间-光谱特征
在线阅读 下载PDF
基于空间通道注意力机制与多尺度融合的交通标志识别研究 被引量:8
2
作者 黄志强 李军 《南京邮电大学学报(自然科学版)》 北大核心 2022年第2期93-102,共10页
通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图... 通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图的语义信息,将第19层卷积层通过上采样后与第7层卷积层相连接,多尺度融合后输入YOLO层形成新的特征金字塔,以此提高小目标的识别率。同时,为使网络更加关注交通标志的细节信息,在特征金字塔网络中增添能够增强前景信息降低背景信息的空间通道注意力机制。使用Kmeans聚类算法对数据集作聚类处理,获得一组先验框。在长沙理工大学交通标志数据集上进行测试,实验结果表明,改进后算法的识别率达到91.8%,与YOLOV3-tiny算法相比提高了24.9个百分点,而与YOLOV3算法相比,每张图片的检测时间降低至0.133s,降低了49.6%,该算法具有较强的实时性和准确性。 展开更多
关键词 交通标志 轻量化网络 YOLOV3-3ctiny 多尺度融合 特征金字塔 空间通道注意力机制
在线阅读 下载PDF
一种新的基于通道-空间融合注意力及SwinT的细粒度图像分类算法
3
作者 姜昊 凌萍 陈寸生保 《南京师范大学学报(工程技术版)》 CAS 2023年第3期36-42,共7页
细粒度图像分类是计算机视觉领域的一大分类任务,其难点在于如何通过类别监督信息自主地找到判别性区域.提出一种新的通道-空间融合注意力模块,基于该模块设计了一种新的Swin Transformer算法SwinT⁃NCSA(a Swin Transformer based on a ... 细粒度图像分类是计算机视觉领域的一大分类任务,其难点在于如何通过类别监督信息自主地找到判别性区域.提出一种新的通道-空间融合注意力模块,基于该模块设计了一种新的Swin Transformer算法SwinT⁃NCSA(a Swin Transformer based on a novel channel⁃spatial attention module),分别从通道维和空间维同时提取特征,再将其融入到Swin Transformer模型中以提高其小尺度中多头注意力信息的提取能力.SwinT⁃NCSA算法特别关注了对分类有用的区域,同时忽视对分类无用的背景区域,以此在细粒度图像分类任务中达到较高的分类准确率.在FGVC Aircraft飞机数据集、CUB-200-2011鸟类数据集和Stanford Cars车类数据集3个公共数据集上的实验表明,SwinT⁃NCSA算法可以分别取得93.3%、88.4%和94.7%的准确率,优于同类算法. 展开更多
关键词 细粒度图像分类 Swin TRANSFORMER 通道-空间融合注意力模块 深度学习 弱监督学习
在线阅读 下载PDF
增强小目标检测性能的通道自注意力机制算法研究 被引量:3
4
作者 尹芹 方晖 +3 位作者 王金东 王侃 晏天文 霍智勇 《南京邮电大学学报(自然科学版)》 北大核心 2022年第4期69-74,共6页
小目标检测是计算机视觉领域具有挑战性的问题。空间注意力和通道注意力机制的使用提高了目标检测网络的均值平均精度,但捕获小物体上下文信息的能力仍然有限,并且在小目标和大中型目标的检测精度上存在差距,难以感知小物体的位置。算... 小目标检测是计算机视觉领域具有挑战性的问题。空间注意力和通道注意力机制的使用提高了目标检测网络的均值平均精度,但捕获小物体上下文信息的能力仍然有限,并且在小目标和大中型目标的检测精度上存在差距,难以感知小物体的位置。算法构建了一种基于通道自注意力机制(Channel Self-Attention, CSA)的算法模块,将输入特征映射压缩后,运用自注意力机制建立特征通道间相关性,自适应地重新优化特征通道的响应,提升了捕获小物体远距离上下文信息的能力,从而提高了对小目标的检测精度。实验结果表明,在几乎不增加计算成本的情况下,CSA块能够为现有目标检测网络带来性能改进。在PASCAL VOC2007数据集上,采用通道自注意力机制的RetinaNet的mAP值分别比原始RetinaNet的mAP值高3.11个百分点。使用通道自注意力机制的MobileNetv2比原始的MobileNetv2 mAP值提高3.05个百分点。 展开更多
关键词 注意力机制 小目标检测 注意力 通道注意力 空间注意力
在线阅读 下载PDF
融合空洞空间金字塔池化和注意力的轻量化遥感影像道路提取 被引量:3
5
作者 刘志恒 岳子腾 +3 位作者 周绥平 江澄 节永师 陈雪梅 《航天返回与遥感》 CSCD 北大核心 2024年第1期111-122,共12页
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块... 针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35%、2.15%、4.1%、3.15%和14.34%,且减少了36.1%的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。 展开更多
关键词 道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像
在线阅读 下载PDF
基于注意力机制和小波变换的图像隐写方法
6
作者 李佩佩 陈燕 +1 位作者 王康谊 张权 《中北大学学报(自然科学版)》 CAS 2024年第6期737-743,共7页
为了更好地平衡隐写容量和不可感知性之间的关系,本文提出了一种基于SteganoGAN的优化方案。首先,将SteganoGAN隐写网络和提取网络进行加深,以增强模型的复杂度和学习能力;其次,为了实现更为隐蔽的信息嵌入,在隐写网络部分引入离散小波... 为了更好地平衡隐写容量和不可感知性之间的关系,本文提出了一种基于SteganoGAN的优化方案。首先,将SteganoGAN隐写网络和提取网络进行加深,以增强模型的复杂度和学习能力;其次,为了实现更为隐蔽的信息嵌入,在隐写网络部分引入离散小波变换(Discrete Wavelet Transformation,DWT)和逆离散小波变换(Inverse Discrete Wavelet Transform,IDWT)模块,这使得秘密信息能够被有效地嵌入到图像的小波域中;最后,在隐写网络、提取网络中融入了一种改进的通道-空间注意力模块(Improved Channel and Spatial Attention Module,ICAM-SAM),促使模型能够聚焦于图像中的高隐蔽性区域,实现更为精准的信息隐藏。实验结果表明:改进后的模型在提取准确率上提高了0.84百分点,表明其隐写和提取过程更加精确。此外,每像素嵌入率(Reed-Solomon Bits-Per-Pixel,RS-BPP)提高了1.71%,这表明改进后的模型在相同大小的图像中可以隐藏更多的信息。同时,峰值信噪比(Peak Signal to Noise Ratio,PSNR)提高了12.53%、结构相似性(Structural Similarity Index,SSIM)提高了5.14%,这表明嵌入的信息对原始图像的影响更小,改进后的模型具有更高的图像质量。综合结果表明,改进后的模型具有更好的不可感知性和较大的隐写容量。 展开更多
关键词 图像隐写 生成对抗网络 离散小波变换 逆离散小波变换 改进的通道-空间注意力模块
在线阅读 下载PDF
基于混合域残差注意力网络的滚动轴承智能故障诊断方法 被引量:1
7
作者 贾立新 陈永毅 +1 位作者 倪洪杰 张丹 《高技术通讯》 CAS 北大核心 2024年第1期101-110,共10页
机械设备正朝着大型化、精密化和自动化的方向发展,机械系统也因此变得越来越复杂。考虑到机械系统可能会发生无特征的灾难性故障,因此机械故障的自动检测是一个巨大的挑战。然而,现有的故障检测方法在对高度复杂的工业系统进行故障类... 机械设备正朝着大型化、精密化和自动化的方向发展,机械系统也因此变得越来越复杂。考虑到机械系统可能会发生无特征的灾难性故障,因此机械故障的自动检测是一个巨大的挑战。然而,现有的故障检测方法在对高度复杂的工业系统进行故障类型识别时,误诊率较高,无法给出准确的故障诊断结果。针对这一问题,本文以滚动轴承这一机械设备关键部件作为研究对象,提出一种基于混合域残差注意力网络的故障诊断方法,旨在结合深度卷积神经网络自动学习表示的优点,并配合通道注意力机制和空间注意力机制的关键特征提取能力,提高故障检测性能。实验结果表明,所提出的方法能够准确地检测轴承故障类型,在准确度指标方面优于其他方法。 展开更多
关键词 故障诊断 滚动轴承 通道注意力机制 空间注意力机制 卷积神经网络(CNN)
在线阅读 下载PDF
基于残差网络注意力机制的人脸表情识别 被引量:2
8
作者 郭昕刚 沈紫琪 《长春工业大学学报》 2023年第3期262-268,共7页
提出一种基于残差网络的人脸表情识别方法。以残差网络为基础,加入裁剪掩码对图像任意区域任意大小遮掩,通过通道注意力机制对重要程度不同的通道分配不同权重,以增加抓取关键信息能力,将多尺度特征与空间注意力机制相结合,以不同感受... 提出一种基于残差网络的人脸表情识别方法。以残差网络为基础,加入裁剪掩码对图像任意区域任意大小遮掩,通过通道注意力机制对重要程度不同的通道分配不同权重,以增加抓取关键信息能力,将多尺度特征与空间注意力机制相结合,以不同感受野提取信息,提高网络提取能力,使用联合损失函数增加类外距离,减小类内距离。将此网络运用到FER2013,CK+数据集中。实验结果表明,识别率分别为64.81%,96.86%,参数量为5.21 M。 展开更多
关键词 表情识别 残差网络 通道注意力机制 多尺度空间注意力机制
在线阅读 下载PDF
基于混合域注意力机制的服装关键点定位及属性预测算法 被引量:3
9
作者 雷冬冬 王俊英 +2 位作者 董方敏 臧兆祥 聂雄锋 《东华大学学报(自然科学版)》 CAS 北大核心 2022年第4期28-35,共8页
针对服装形变和模特复杂姿态影响服装视觉分析准确率的问题,提出一个基于混合域注意力机制的服装关键点定位与属性预测算法,该算法利用循环十字交叉注意力(recurrent criss-cross attention,RCCA)模块得到服装图像的每个像素的上下文信... 针对服装形变和模特复杂姿态影响服装视觉分析准确率的问题,提出一个基于混合域注意力机制的服装关键点定位与属性预测算法,该算法利用循环十字交叉注意力(recurrent criss-cross attention,RCCA)模块得到服装图像的每个像素的上下文信息,从而捕获服装关键点之间潜在的空间几何关系,再融合服装图像的空间联系和通道交互信息来获得更好的服装关键点定位和属性预测效果。服装的空间特征由空间注意力分支网络在关键点热图的基础上学习得到,而通道交互信息通过局部跨通道交互策略生成通道注意力来捕获。试验结果表明,所提算法降低了服装关键点定位的归一化误差,并在一定程度上提高了服装的分类与属性预测效果。 展开更多
关键词 服装关键点定位 属性预测 混合域注意力机制 非局部空间连接 局部跨通道交互
在线阅读 下载PDF
基于注意力机制的跨分辨率行人重识别 被引量:8
10
作者 廖华年 徐新 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期605-612,共8页
行人图像分辨率的变化对现有的行人重识别方法带来了很大的挑战。针对这一问题,提出了一种新的跨分辨率行人重识别方法。该方法从两方面解决分辨率变化带来的识别困难:一方面通过通道注意力机制和空间注意力机制捕捉人物特征获取局部区... 行人图像分辨率的变化对现有的行人重识别方法带来了很大的挑战。针对这一问题,提出了一种新的跨分辨率行人重识别方法。该方法从两方面解决分辨率变化带来的识别困难:一方面通过通道注意力机制和空间注意力机制捕捉人物特征获取局部区域;另一方面通过核动态上采样模块恢复任意分辨率图像的局部区域信息。为了验证所提方法的有效性,在Market1501、CUHK03和CAVIAR三个公开数据集上开展了对比实验,实验结果表明:所提方法取得了最佳性能。 展开更多
关键词 行人重识别 通道注意力机制 空间注意力机制 图像超分辨率 上采样
在线阅读 下载PDF
基于一种视觉注意力机制的图像描述方法 被引量:1
11
作者 薛炜 刘惠义 《信息技术》 2020年第1期63-66,共4页
为了提高由图像生成文字描述的准确率,文中提出了一种基于传统的编码解码框架,分别在编码端和解码端融入视觉注意力机制的方法,即在编码端加入空间注意力机制和图像通道级注意力机制相结合的方法。在解码端运用自适应视觉注意力机制的方... 为了提高由图像生成文字描述的准确率,文中提出了一种基于传统的编码解码框架,分别在编码端和解码端融入视觉注意力机制的方法,即在编码端加入空间注意力机制和图像通道级注意力机制相结合的方法。在解码端运用自适应视觉注意力机制的方法,即在传统的解码端上加入一个额外的“视觉哨兵”模块。文中提出的方法在生成文字描述的过程中自动决定是依赖图像特征还是依赖语义特征,并传递给相应的注意力机制。实验证明,相比较单一的视觉注意力机制,文中方法取得了较高的图像描述语句的正确率,具有更好的图像描述性能。 展开更多
关键词 图像描述 空间注意力机制 通道注意力机制 视觉哨兵 视觉注意力机制
在线阅读 下载PDF
基于半监督空间-通道选择性卷积核网络的极化SAR图像地物分类 被引量:3
12
作者 王睿川 王岩飞 《雷达学报(中英文)》 CSCD 北大核心 2021年第4期516-530,共15页
针对极化合成孔径雷达(极化SAR)图像地物分类中标注样本数量少的问题,该文提出一种基于空间-通道选择性卷积核全卷积网络(SCSKFCN)和预选-联合优化半监督学习(SPUO)的极化SAR图像地物分类方法。SCSKFCN通过使用空间和通道注意力机制,对... 针对极化合成孔径雷达(极化SAR)图像地物分类中标注样本数量少的问题,该文提出一种基于空间-通道选择性卷积核全卷积网络(SCSKFCN)和预选-联合优化半监督学习(SPUO)的极化SAR图像地物分类方法。SCSKFCN通过使用空间和通道注意力机制,对不同感受野的特征进行自适应加权融合,有效提升了模型的分类性能。SPUO能够高效地利用标注样本,挖掘无标注样本中蕴含的信息。它采用K-Wishart距离进行样本预选并生成伪标签,然后在联合优化阶段使用真实标注样本和伪标注样本同时对模型进行优化。在模型优化过程中,SPUO对伪标注样本进行两步验证并筛选可靠的伪标注样本参与优化。实验结果表明,该方法能够在只使用少量标注样本的条件下实现高精度、高效率的极化SAR图像地物分类。 展开更多
关键词 极化SAR图像地物分类 全卷积网络 注意力机制 半监督学习 空间-通道选择性卷积核网络
在线阅读 下载PDF
基于注意力和多级特征融合的铁路场景小尺度行人检测算法 被引量:6
13
作者 石瑞姣 陈后金 +3 位作者 李居朋 李艳凤 李丰 万成凯 《铁道学报》 EI CAS CSCD 北大核心 2022年第5期76-83,共8页
行人入侵是影响铁路行车安全的重要因素。为有效解决短焦距摄像机在大视场中小尺度行人检测精度低的问题,提出一种注意力机制引导下的多级特征融合网络模型。首先,将YOLOv3作为主干网络,针对多次降采样后行人特征丢失的问题,设计四倍降... 行人入侵是影响铁路行车安全的重要因素。为有效解决短焦距摄像机在大视场中小尺度行人检测精度低的问题,提出一种注意力机制引导下的多级特征融合网络模型。首先,将YOLOv3作为主干网络,针对多次降采样后行人特征丢失的问题,设计四倍降采样分支以利用高分辨率特征有效提取小尺度行人信息。其次,特征融合阶段引入通道-空间注意力机制以抑制低层特征中背景噪声干扰。最后,引入CIoU损失函数用于行人目标框的回归,解决均方误差损失函数存在的优化不一致及尺度敏感问题。实验结果表明,相较于经典YOLOv3以及现阶段主流目标检测算法,本算法具有更高的检测精度,在自建铁路私有数据集和Caltech公开数据集的各子集上对数平均漏检率均有明显降低。 展开更多
关键词 铁路行车安全 小尺度行人检测 多级特征融合 通道-空间注意力 CIoU损失函数
在线阅读 下载PDF
融合多尺度注意力和累积学习的白血病分类识别
14
作者 李家成 叶哲江 张鹏飞 《现代电子技术》 2023年第19期49-54,共6页
急性淋巴细胞白血病(ALL)图像数据集中有着类间形态学相似、数据不平衡的问题。文中设计了一种包含多尺度空间注意力和通道注意力的卷积模块,可以更好地提取不同类别图像的细颗粒特征信息,用于分类器的预测分类。使用加权交叉熵损失函... 急性淋巴细胞白血病(ALL)图像数据集中有着类间形态学相似、数据不平衡的问题。文中设计了一种包含多尺度空间注意力和通道注意力的卷积模块,可以更好地提取不同类别图像的细颗粒特征信息,用于分类器的预测分类。使用加权交叉熵损失函数惩罚样本数量多的类,让模型学习不会偏向多数类。在此基础上引入累积学习策略,随着训练进程动态地调整正常损失函数和加权损失函数的比重,避免了加权损失函数对表征学习的损害,保持了对分类器的促进效果。最终在开源白血病细胞图像数据集C-NMC验证该设计方法的可行性,实验结果表明,测试集F1分数达到96.2%,对白血病细胞图像有着良好的识别效果。 展开更多
关键词 急性淋巴细胞白血病 加权损失函数 空间注意力机制 通道注意力机制 累积学习 卷积神经网络 深度卷积 类平衡策略
在线阅读 下载PDF
钢轨表面缺陷检测Mask R-CNN算法研究与优化 被引量:1
15
作者 孟瑞锋 梁桢 +2 位作者 贾超 乔志 赵晨 《都市快轨交通》 北大核心 2024年第5期68-77,共10页
为有效防止城市轨道交通事故发生,更好地保障运行安全,钢轨表面缺陷检测技术在巡检工作中发挥着重要作用。针对现有钢轨缺陷检测技术中检测精度差、小目标敏感度低等问题,在Mask R-CNN(mask region-based convolutional neural network... 为有效防止城市轨道交通事故发生,更好地保障运行安全,钢轨表面缺陷检测技术在巡检工作中发挥着重要作用。针对现有钢轨缺陷检测技术中检测精度差、小目标敏感度低等问题,在Mask R-CNN(mask region-based convolutional neural network)算法模型基础上,提出一种融合注意力机制的模型改进方案。该方案在特征提取网络中引入通道-空间复合注意力机制(channel-wise spatial module,CSM)用于实例分割缺陷检测,有效剔除干扰信息,获得多尺度特征表达,得到更多空间信息以及更优的浅层信息,从而提升对钢轨表面缺陷边缘检测能力。在相同的实验环境下,相对于Mask R-CNN算法,加入CSM后,Mask R-CNN模型的平均精度均值(mean average precision,mAP)提高了6.5%。其中,对钢轨“凹陷”“裂纹”以及“疲劳磨损”缺陷识别的平均精度(average precision,AP)分别提高了6.3%、6.9%和6.1%。横向对比发现,加入CSM后的Mask R-CNN模型,相较于Fast R-CNN模型,三种缺陷的分割效果分别提升了11.6%、12.5%和12.9%。同时,相较于Faster R-CNN模型,三种缺陷的分割效果分别提升了8.8%、10.0%和10.3%。加入CSM后的Mask R-CNN模型可以更好地识别三类缺陷,提升检测精度和小目标敏感度,为轨道智能巡检提供更安全有力的技术支持和保障。 展开更多
关键词 城市轨道交通 通道-空间注意力机制 钢轨缺陷 实例分割 Mask R-CNN算法
在线阅读 下载PDF
基于并行反向注意网络的跑道线检测
16
作者 白俊卿 张文静 《中国惯性技术学报》 EI CSCD 北大核心 2022年第5期609-614,共6页
针对无人机远距离跑道线检测时有效信息少且定位困难的问题,提出了一种基于并行反向注意网络的跑道线检测方法。并行反向注意网络采用Res2Net作为主干网络,首先采用并行融合编码器将低级特征与高级特征融合从而获取跑道线的初始轮廓图... 针对无人机远距离跑道线检测时有效信息少且定位困难的问题,提出了一种基于并行反向注意网络的跑道线检测方法。并行反向注意网络采用Res2Net作为主干网络,首先采用并行融合编码器将低级特征与高级特征融合从而获取跑道线的初始轮廓图。在此基础上,融合通道特征金字塔和轴向反向注意力机制来增强图像中的全局和局部特征信息的表达能力。基于无人机着陆图像数据集的仿真试验结果表明所提出的算法有效地检测出跑道线,图像语义分割平均交并比达到86.3%,单帧处理时间25 ms,对于远距离小目标检测有明显的优势。 展开更多
关键词 Res2Net 并行编码器 通道特征金字塔 注意力机制
在线阅读 下载PDF
基于改进YOLOv8n的井下人员多目标检测
17
作者 问永忠 贾澎涛 +2 位作者 夏敏高 张龙刚 王伟峰 《工矿自动化》 北大核心 2025年第1期31-37,77,共8页
针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSE... 针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSEAM),以增强对遮挡目标的检测性能;在C2f模块中引入混合局部通道注意力(MLCA)机制,构建C2f-MLCA模块,以融合局部和全局特征信息,提高特征表达能力;在Head层检测头中嵌入自适应空间特征融合(ASFF)模块,以增强对小尺度目标的检测性能。实验结果表明:(1)与Faster R-CNN,SSD,RT-DETR,YOLOv5s,YOLOv7等主流模型相比,YOLOv8n-MSMLAS综合性能表现最佳,mAP@0.5和mAP@0.5:0.95分别达到93.4%和60.1%,FPS为80.0帧/s,参数量为5.80×106个,较好平衡了模型的检测精度和复杂度。(2)YOLOv8n-MSMLAS在光照不均、目标尺度不一致、遮挡等条件下表现出较好的检测性能,适用于现场检测。 展开更多
关键词 煤矿井下危险区域 井下人员多目标检测 YOLOv8n 多尺度空间增强注意力机制 自适应空间特征融合 轻量化混合局部通道注意力机制
在线阅读 下载PDF
基于空间几何特征融合增强的地铁隧道点云语义分割神经网络模型 被引量:1
18
作者 张秋昭 梁嘉辉 +2 位作者 段浩然 王宗伟 段伟 《金属矿山》 CAS 北大核心 2023年第5期237-246,共10页
基于深度学习的隧道点云语义分割技术能够对大规模点云数据中的物体对象进行识别与分类,可以实现隧道场景内物体信息的提取与管理。顾及地铁隧道内设施的空间分布特征与几何特点,提出了一种基于空间几何特征融合增强的地铁隧道点云语义... 基于深度学习的隧道点云语义分割技术能够对大规模点云数据中的物体对象进行识别与分类,可以实现隧道场景内物体信息的提取与管理。顾及地铁隧道内设施的空间分布特征与几何特点,提出了一种基于空间几何特征融合增强的地铁隧道点云语义分割神经网络模型。设计了隧道点云空间几何特征提取模块,提取了隧道设施点云的相对空间位置与几何分布特征,将其与相应的网络编码层的点云信息进行通道拼接,以增强网络模型对多尺度点云特征信息的感知能力。构建了基于通道注意力机制的特征融合编码层,提取不同通道间特征信息的权重,对不同空间尺度的点云信息进行加权融合,以充分利用不同尺度的信息来提高模型的表示和泛化能力。利用南京某地铁隧道实测点云数据制作语义分割数据集,对所提模型进行了验证。结果表明:模型的训练mIoU值达到0.9556;在测试数据集上的预测结果中,加权平均F1分数为0.9959,加权平均IoU值为0.9631;对于PointNet++模型分割精度较差的通信光缆、管线架、接触吊梁类别,本研究模型的IoU值分别达到0.845、0.825和0.999,有效提高了地铁隧道点云分割的整体准确性,可为实现地铁隧道自动化病害巡检与设施管理提供技术参考。 展开更多
关键词 点云语义分割 通道注意力机制 空间几何特征 PointNet++
在线阅读 下载PDF
复杂战场环境下改进YOLOv5军事目标识别算法研究 被引量:7
19
作者 宋晓茹 刘康 +2 位作者 高嵩 陈超波 阎坤 《兵工学报》 EI CAS CSCD 北大核心 2024年第3期934-947,共14页
复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战... 复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战场军事单元的识别锚框进行重新聚类,以提升模型对于目标大小适应度,加速模型收敛;采用通道-空间并行注意力机制,增加模型对复杂战场环境下目标特征信息与位置信息关注度;在特征融合网络部分使用BiFPN以提升模型对于特征的融合能力与速度;采用Alpha_IoU损失函数加速模型收敛,解决当真实框与预测框重合时IoU计算退化问题。实验结果表明,在自建军事目标数据集下,改进算法与主流目标识别算法相比,在保证模型空间复杂度的同时,mAP值达到了90.17%。消融实验对比结果表明,改进后网络较原模型精度提升11.57%,具有较好的识别性能,能够为战场情报获取提供有效的技术支撑。 展开更多
关键词 军事目标识别 通道-空间并行注意力机制 特征融合 损失函数
在线阅读 下载PDF
基于卷积注意力模块的人体姿态估计研究
20
作者 廉继红 薛维哥 +1 位作者 王延年 张楠 《西安工程大学学报》 2025年第2期1-9,共9页
为了进一步确保自动驾驶的行人安全,针对人体姿态估计存在关键点误检、漏检、冗余的问题,以HRNet为骨干网络进行算法优化,从而进一步提高模型检测精度。首先,在图像特征提取时设计了一个人体姿态估计模型推理网络RSGNet,在关键点推理的... 为了进一步确保自动驾驶的行人安全,针对人体姿态估计存在关键点误检、漏检、冗余的问题,以HRNet为骨干网络进行算法优化,从而进一步提高模型检测精度。首先,在图像特征提取时设计了一个人体姿态估计模型推理网络RSGNet,在关键点推理的过程中剔除干扰关键点带来的影响,提高模型对关键点信息的有效利用;其次,针对自遮挡或者外界干扰的影响导致图像细节信息不完全的问题,在图像特征处理时加入了卷积注意力模块(convolutional block attention module,CBAM),该模块结合了空间与通道的关联融合信息,减少了前景、背景等信息对图像处理的负面影响。实验结果表明:相较于基准模型HRNet方法,改进后的网络模型明显提高了人体姿态估计的检测精度,在公共数据集COCO的平均准确率(average precision,AP)提高了7.3%,在公共数据集MPII的AP提高了3.0%。 展开更多
关键词 姿态估计 自动驾驶 关键点 注意力机制 空间注意力 通道注意力
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部