针对水下图像标注数据稀缺导致增强算法泛化性不足的问题,本文提出一种基于均值教师(Mean-Teacher)模型的半监督水下图像增强框架。设计融合光照和梯度先验的多尺度网络(Illumination and Gradient Prior network,IGP-Net)作为均值教师...针对水下图像标注数据稀缺导致增强算法泛化性不足的问题,本文提出一种基于均值教师(Mean-Teacher)模型的半监督水下图像增强框架。设计融合光照和梯度先验的多尺度网络(Illumination and Gradient Prior network,IGP-Net)作为均值教师模型的主干网络。IGP-Net包括以下3个模块:多尺度照明感知模块MSLP,用来提取退化图像的多尺度特征,并融合光照和梯度先验,提升水下图像对比度;多通道细节增强模块MCE,对初步增强图像进行通道维拆分和颜色补偿,改善水下图像颜色失真现象;并行注意力模块PC,利用像素注意力和通道注意力进一步关注照明信息和颜色信息之间的关联性,实现色彩均衡。在公开数据集上的定量比较和定性分析表明,本文所提方法在多个关键指标上优于现有先进算法。此外,在水下目标检测任务中的实验,也表明了经本文算法增强后的图像能够有效提升水下目标检测的性能。展开更多
针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融...针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融合新的构建模块以提升特征提取效率;引入内容感知特征重组模块和大型选择性核网络,增强颈部网络对遮挡目标的上下文感知能力;采用Wise-IoU损失函数优化边界框回归稳定性。在VisDrone2019数据集上的实验结果表明,EFLF-Net较基准模型在平均精度上提高了5.2%。与已有代表性的目标检测算法相比,该方法对存在小目标、目标相互遮挡和复杂背景的无人机航拍图像有更好的检测效果。展开更多
针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(...针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(re-parameterization multi-scale large kernel convolution)。该网络通过空间和通道重构注意力模块,将注意值集中到对检测任务更重要的区域。通过Sobel算子强化边缘特征,提高对不同姿态人体的检测能力。RML-YOLO的有效性在自制数据集上得到验证。在只有1.8×10~6可学习参数的情况下,模型的AP50和AP50-75分别达到了91.2%和87.3%,与参数量相近的YOLOv8-n相比分别提高了4.4%和5.3%。结果表明,RML-YOLO显著提高了利用红外图像进行废墟环境下人体检测的精度。展开更多
文摘针对水下环境复杂性带来的多尺度目标检测挑战,提出了改进算法WPS-YOLOv8。设计了小波池化卷积模块(wavelet pooling convolution,WPConv),该模块通过小波池化技术降低通道压缩后特征图的分辨率,有效抑制了传统下采样过程中产生的频率混叠伪影,提升了特征提取质量和表达能力。提出了局部逐点分组重排卷积模块(partial pointwise group shuffle convolution,PGConv),该模块通过结合局部卷积与逐点卷积,能够在减少信息冗余的同时保持通道间的信息交互,弥补了深度可分离卷积的不足,增强了特征融合效果。提出了ShapeLoss损失函数,综合考虑影响不同尺度目标检测精度的因素,通过集成Shape-IoU和Shape-NWD两种损失测度,有效提升了对多尺度目标的总体检测精度。实验结果显示,相较于YOLOv8,WPS-YOLOv8在URPC2018和UTDAC2020水下数据集上的平均精度均值(mean average precision,mAP)分别提升了8.6和4.4个百分点,展现了其在水下多尺度目标检测中的出色表现。
文摘针对水下图像标注数据稀缺导致增强算法泛化性不足的问题,本文提出一种基于均值教师(Mean-Teacher)模型的半监督水下图像增强框架。设计融合光照和梯度先验的多尺度网络(Illumination and Gradient Prior network,IGP-Net)作为均值教师模型的主干网络。IGP-Net包括以下3个模块:多尺度照明感知模块MSLP,用来提取退化图像的多尺度特征,并融合光照和梯度先验,提升水下图像对比度;多通道细节增强模块MCE,对初步增强图像进行通道维拆分和颜色补偿,改善水下图像颜色失真现象;并行注意力模块PC,利用像素注意力和通道注意力进一步关注照明信息和颜色信息之间的关联性,实现色彩均衡。在公开数据集上的定量比较和定性分析表明,本文所提方法在多个关键指标上优于现有先进算法。此外,在水下目标检测任务中的实验,也表明了经本文算法增强后的图像能够有效提升水下目标检测的性能。
文摘针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融合新的构建模块以提升特征提取效率;引入内容感知特征重组模块和大型选择性核网络,增强颈部网络对遮挡目标的上下文感知能力;采用Wise-IoU损失函数优化边界框回归稳定性。在VisDrone2019数据集上的实验结果表明,EFLF-Net较基准模型在平均精度上提高了5.2%。与已有代表性的目标检测算法相比,该方法对存在小目标、目标相互遮挡和复杂背景的无人机航拍图像有更好的检测效果。
文摘针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(re-parameterization multi-scale large kernel convolution)。该网络通过空间和通道重构注意力模块,将注意值集中到对检测任务更重要的区域。通过Sobel算子强化边缘特征,提高对不同姿态人体的检测能力。RML-YOLO的有效性在自制数据集上得到验证。在只有1.8×10~6可学习参数的情况下,模型的AP50和AP50-75分别达到了91.2%和87.3%,与参数量相近的YOLOv8-n相比分别提高了4.4%和5.3%。结果表明,RML-YOLO显著提高了利用红外图像进行废墟环境下人体检测的精度。