期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于位置编码重叠切块嵌入和多尺度通道交互注意力的鱼类图像分类 被引量:1
1
作者 周雯 谌雨章 +1 位作者 温志远 王诗琦 《计算机应用》 CSCD 北大核心 2024年第10期3209-3216,共8页
水下鱼类图像分类是一项极具挑战性的任务。传统Vision Transformer(ViT)网络骨干的局限性较大,难以处理局部连续特征,在图像质量较低的鱼类分类中效果表现不佳。为解决此问题,提出一种基于位置编码的重叠切块嵌入(OPE)和多尺度通道交... 水下鱼类图像分类是一项极具挑战性的任务。传统Vision Transformer(ViT)网络骨干的局限性较大,难以处理局部连续特征,在图像质量较低的鱼类分类中效果表现不佳。为解决此问题,提出一种基于位置编码的重叠切块嵌入(OPE)和多尺度通道交互注意力(MCIA)的Transformer图像分类网络PIFormer(Positional overlapping and Interactive attention transFormer)。PIFormer采用多层级形式构建,每层以不同次数堆叠,利于提取不同深度的特征。首先,引入深度位置编码重叠切块嵌入(POPE)模块对特征图与边缘信息进行重叠切块,以保留鱼体的局部连续特征,并添加位置信息以排序,帮助PIFormer整合细节特征和构建全局映射;其次,提出MCIA模块并行处理局部与全局特征,并建立鱼体不同部位的长距离依赖关系;最后,由分组多层感知机(GMLP)分组处理高层次特征,以提升网络效率,并实现最终的鱼类分类。为验证PIFormer的有效性,提出自建东湖淡水鱼类数据集,并使用公共数据集Fish4Knowledge与NCFM(Nature Conservancy Fisheries Monitoring)以确保实验公平性。实验结果表明,所提网络在各数据集上的Top-1分类准确率分别达到了97.99%、99.71%和90.45%,与同级深度的ViT、Swin Transformer和PVT(Pyramid Vision Transformer)相比,参数量分别减少了72.62×10^(6)、14.34×10^(6)和11.30×10^(6),浮点运算量(FLOPs)分别节省了14.52×10^(9)、2.02×10^(9)和1.48×10^(9)。可见,PIFormer在较少的计算负荷下,具有较强的鱼类图像分类能力,取得了优越的性能。 展开更多
关键词 鱼类图像分类 位置编码 重叠切块嵌入 通道交互注意力 Vision Transformer
在线阅读 下载PDF
基于多通道交互注意力机制与边缘轮廓增强的红外无人机检测
2
作者 聂苏珍 曹杰 +1 位作者 郝群 庄须叶 《红外与毫米波学报》 2025年第3期335-345,共11页
无人机因其小巧、轻便、灵活的特点,在农业、物流、救援、赈灾等方面有着广泛的应用。然而如果使用不当或管理不善,不仅会造成个人隐私泄露、财产损失,还可能对公共安全甚至军事安全构成威胁。因此,实时准确地对空域内的无人机进行检测... 无人机因其小巧、轻便、灵活的特点,在农业、物流、救援、赈灾等方面有着广泛的应用。然而如果使用不当或管理不善,不仅会造成个人隐私泄露、财产损失,还可能对公共安全甚至军事安全构成威胁。因此,实时准确地对空域内的无人机进行检测与预警具有重要作用。对此,提出了一种用于红外无人机检测的多通道交互注意力与边缘轮廓增强(Multi-Channel Interactive Attention mechanism and Edge Contour Enhancement,MCIAECE)方法。首先,通过构建多通道交互注意力机制模块和边缘轮廓增强模块组成的双通道对红外图像的浅层和深层特征进行提取,经过注意力机制可以增强目标特征,而边缘轮廓增强则可以获取更多细节信息。然后使用多级特征融合模块将所提取的各层特征进行融合增强,从而获得检测结果。实验结果表明,在3个数据集上用MCIAECE方法都能够达到较好的效果。其中在(NUDT-Single-frame InfraRed Small Target)NUDT-SIRST红外数据集上效果最佳,检测概率和交并比分别为98.83%和85.11%,与基线网络相比分别提高了1.95%和6.88%,与其他方法相比,在目标的边缘轮廓还原方面效果显著。 展开更多
关键词 通道交互注意力机制 边缘轮廓增强 多级特征融合 红外无人机检测
在线阅读 下载PDF
基于MBDC和双重注意力的变电站人员穿戴检测 被引量:4
3
作者 纪超 侯威 +3 位作者 高鸣江 张凡 杨鹏 李小兵 《电子测量与仪器学报》 CSCD 北大核心 2023年第6期247-255,共9页
安全帽与工作服是变电站工作人员安全的重要保障,为解决现有检测模型对其检测精度低的问题,本文提出了MBDC和双重注意力的变电站人员穿戴检测算法。该算法提出了多分支深度卷积(multi branch deep convolution,MBDC)网络增加深度可分离... 安全帽与工作服是变电站工作人员安全的重要保障,为解决现有检测模型对其检测精度低的问题,本文提出了MBDC和双重注意力的变电站人员穿戴检测算法。该算法提出了多分支深度卷积(multi branch deep convolution,MBDC)网络增加深度可分离卷积层以增强特征提取的完备性;然后提出多通道交互注意力(multimodal interaction attention,MIA)增加模型对小目标的检测能力,并将MIA机制结合高效通道注意力(efficient channel attention,ECA)机制构成双重注意力机制,增强模型对于小目标和遮挡目标的识别精度;最后引入焦点损失函数和SIOU(scylla intersection over union)作为损失函数以解决正负样本不平衡问题并加快收敛速度。实验表明,本文算法全类平均精度达到84.88%,比原算法高9.92%,总体性能优于对比算法。 展开更多
关键词 变电站人员穿戴 多分支深度卷积 双重注意力机制 通道交互注意力 高效通道注意力
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部