遥感图像的目标检测在各领域有着广泛的应用场景,由于遥感图像中检测目标存在形态多变、弱小目标较多以及背景复杂等原因,导致遥感图像在目标检测方面存在检测精度识别不高、模型参数过大等问题。为提升算法对遥感图像目标的检测准确率...遥感图像的目标检测在各领域有着广泛的应用场景,由于遥感图像中检测目标存在形态多变、弱小目标较多以及背景复杂等原因,导致遥感图像在目标检测方面存在检测精度识别不高、模型参数过大等问题。为提升算法对遥感图像目标的检测准确率以及缩减算法模型量,提出了动态聚焦多维注意力检测算法——YOLO-WiseGOD。在YOLOv8n基线网络中使用WIoU(Wise-IoU)构建动态聚焦机制的边界框损失,弱化因几何因素导致的梯度增益泛化能力不足的问题,在协调高低质量锚框竞争力的同时,使之适用于聚焦普通锚框,提高网络模型检测的定位能力。在网络末端融合改进的L-ODConv(Leaky ReLU-Omni-Dimensional Dynamic Convolution)多维注意力机制,避免梯度锯齿问题,在减少模型参数的同时,优化输出特征和卷积权值的调制,提升网络加权特征融合。在主干网络中引入轻量化注意力模块C2FGhostV2,在更好地捕捉输入特征图中的多尺度特征和全局上下文信息的同时,保持较低的参数量和计算复杂度,更好地平衡训练精度和模型量之间的关系。所提算法在遥感数据集NWPU VHR-10(Northwestern Polytechnical University Very High Resolution-10)和RSOD(Remote Sensing Object Detection)上进行实验验证,对比当前主流算法模型YOLOv8n,其平均检测准确率(mean Average Precision,mAP)分别提高了2.0%和2.3%,模型参数量减少4.5%,计算量减少10.9%,能有效提高遥感图像中微小目标的检测精度和实现一定的模型轻量化。展开更多
文摘遥感图像的目标检测在各领域有着广泛的应用场景,由于遥感图像中检测目标存在形态多变、弱小目标较多以及背景复杂等原因,导致遥感图像在目标检测方面存在检测精度识别不高、模型参数过大等问题。为提升算法对遥感图像目标的检测准确率以及缩减算法模型量,提出了动态聚焦多维注意力检测算法——YOLO-WiseGOD。在YOLOv8n基线网络中使用WIoU(Wise-IoU)构建动态聚焦机制的边界框损失,弱化因几何因素导致的梯度增益泛化能力不足的问题,在协调高低质量锚框竞争力的同时,使之适用于聚焦普通锚框,提高网络模型检测的定位能力。在网络末端融合改进的L-ODConv(Leaky ReLU-Omni-Dimensional Dynamic Convolution)多维注意力机制,避免梯度锯齿问题,在减少模型参数的同时,优化输出特征和卷积权值的调制,提升网络加权特征融合。在主干网络中引入轻量化注意力模块C2FGhostV2,在更好地捕捉输入特征图中的多尺度特征和全局上下文信息的同时,保持较低的参数量和计算复杂度,更好地平衡训练精度和模型量之间的关系。所提算法在遥感数据集NWPU VHR-10(Northwestern Polytechnical University Very High Resolution-10)和RSOD(Remote Sensing Object Detection)上进行实验验证,对比当前主流算法模型YOLOv8n,其平均检测准确率(mean Average Precision,mAP)分别提高了2.0%和2.3%,模型参数量减少4.5%,计算量减少10.9%,能有效提高遥感图像中微小目标的检测精度和实现一定的模型轻量化。