为提高自然环境中玉米害虫识别的准确性,开发一种基于优化YOLOv8的深度学习模型YOLOv8-LAP。该模型将大型可分离卷积核注意力(LSKA)机制引入特征融合模块空间快速金字塔池化(SPPF),增强多尺度特征提取能力,提升检测性能。针对玉米害虫...为提高自然环境中玉米害虫识别的准确性,开发一种基于优化YOLOv8的深度学习模型YOLOv8-LAP。该模型将大型可分离卷积核注意力(LSKA)机制引入特征融合模块空间快速金字塔池化(SPPF),增强多尺度特征提取能力,提升检测性能。针对玉米害虫图像检测中小目标难以捕捉、背景复杂和光照变化等挑战,在主干网络中加入AFGC(Attention for Fine-Grained Categorization)层,以进一步增强图像特征提取的效果,提升模型的泛化能力和鲁棒性。为保证实时检测和模型轻量化,引入可编程梯度信息(PGI)技术,通过辅助监督优化训练过程,减少参数并加速推理。在9种常见玉米害虫的检测中,YOLOv8-LAP模型的平均精度均值(mAP0.5)达到了95.7%,相较于原始YOLOv8模型提高了4.9个百分点。此外,为验证YOLOv8-LAP模型的效果,开发一款基于PySide6的应用程序,该应用拥有用户友好的图形用户界面(GUI),具有实时图像处理和视频分析功能,并支持静态图像、动态视频和摄像头实时目标检测。可见,YOLOv8-LAP模型在降低漏检率和误检率方面表现突出,目标定位更精准,适用于自然环境下的玉米害虫识别,并为精准施药提供技术支持。展开更多
从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(conce...从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以innerMPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。展开更多
文摘为提高自然环境中玉米害虫识别的准确性,开发一种基于优化YOLOv8的深度学习模型YOLOv8-LAP。该模型将大型可分离卷积核注意力(LSKA)机制引入特征融合模块空间快速金字塔池化(SPPF),增强多尺度特征提取能力,提升检测性能。针对玉米害虫图像检测中小目标难以捕捉、背景复杂和光照变化等挑战,在主干网络中加入AFGC(Attention for Fine-Grained Categorization)层,以进一步增强图像特征提取的效果,提升模型的泛化能力和鲁棒性。为保证实时检测和模型轻量化,引入可编程梯度信息(PGI)技术,通过辅助监督优化训练过程,减少参数并加速推理。在9种常见玉米害虫的检测中,YOLOv8-LAP模型的平均精度均值(mAP0.5)达到了95.7%,相较于原始YOLOv8模型提高了4.9个百分点。此外,为验证YOLOv8-LAP模型的效果,开发一款基于PySide6的应用程序,该应用拥有用户友好的图形用户界面(GUI),具有实时图像处理和视频分析功能,并支持静态图像、动态视频和摄像头实时目标检测。可见,YOLOv8-LAP模型在降低漏检率和误检率方面表现突出,目标定位更精准,适用于自然环境下的玉米害虫识别,并为精准施药提供技术支持。
文摘从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以innerMPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。