针对密集行人检测存在小目标检测精度低、模型复杂的问题,提出一种改进YOLOv8的轻量化密集行人检测方法。引入DualConv模块替换原始Conv模块,帮助更深的卷积层更有效地提取信息,减少计算冗余并提高检测精度;通过融合RepViTBlock结构和...针对密集行人检测存在小目标检测精度低、模型复杂的问题,提出一种改进YOLOv8的轻量化密集行人检测方法。引入DualConv模块替换原始Conv模块,帮助更深的卷积层更有效地提取信息,减少计算冗余并提高检测精度;通过融合RepViTBlock结构和分离与增强注意力机制SEMA(separated and enhancement attention)改进C2f,构建RS-C2f结构,提升模型的泛化和特征融合能力,并降低参数量;设计全新的空间金字塔模块SPPELAN_BiFPN,使模型对小目标行人检测精度显著提高,同时优化计算效率;采用Focal_Shape-IoU作为边界框回归损失函数,加快网络的收敛速度,提高对小目标的检测准确率。实验结果表明,改进模型的mAP@0.5、Precision和Recall在Crowd-Human数据集上提升2.4、1.1和2.1个百分点,在WiderPerson数据集上提升1.3、1.0和1.7个百分点,同时参数量下降39.6%。在嵌入式设备上单帧图像平均运行时间为55.1 ms,平均精度为90.7%,召回率为82.9%,表明改进模型在保证轻量化的同时提升了检测精度和速度。展开更多
文摘针对密集行人检测存在小目标检测精度低、模型复杂的问题,提出一种改进YOLOv8的轻量化密集行人检测方法。引入DualConv模块替换原始Conv模块,帮助更深的卷积层更有效地提取信息,减少计算冗余并提高检测精度;通过融合RepViTBlock结构和分离与增强注意力机制SEMA(separated and enhancement attention)改进C2f,构建RS-C2f结构,提升模型的泛化和特征融合能力,并降低参数量;设计全新的空间金字塔模块SPPELAN_BiFPN,使模型对小目标行人检测精度显著提高,同时优化计算效率;采用Focal_Shape-IoU作为边界框回归损失函数,加快网络的收敛速度,提高对小目标的检测准确率。实验结果表明,改进模型的mAP@0.5、Precision和Recall在Crowd-Human数据集上提升2.4、1.1和2.1个百分点,在WiderPerson数据集上提升1.3、1.0和1.7个百分点,同时参数量下降39.6%。在嵌入式设备上单帧图像平均运行时间为55.1 ms,平均精度为90.7%,召回率为82.9%,表明改进模型在保证轻量化的同时提升了检测精度和速度。