交通标志检测是自动驾驶系统、辅助驾驶系统(DAS)的重要组成部分,对行车安全具有重要意义。针对小目标交通标志检测时受光照、恶劣天气等因素影响而导致的检测精度低、漏检率高等问题,提出一种基于改进YOLOv5的小目标交通标志检测算法...交通标志检测是自动驾驶系统、辅助驾驶系统(DAS)的重要组成部分,对行车安全具有重要意义。针对小目标交通标志检测时受光照、恶劣天气等因素影响而导致的检测精度低、漏检率高等问题,提出一种基于改进YOLOv5的小目标交通标志检测算法。首先,引入空间到深度卷积(SPD-Conv)对特征图进行下采样,有效避免小目标信息丢失,提高小目标敏感度。其次,基于加权双向特征金字塔网络(BiFPN)改进颈部网络,添加跨层连接以融合多尺度特征。之后,增加小目标检测层,增强小目标检测能力。最后,采用SIoU(Shape-aware Intersection over Union)损失函数,关注真实框与预测框的角度信息。实验结果表明,改进后的算法在中国交通标志检测数据集(CCTSDB2021)上的平均精度均值(mAP)达到83.5%,相较于原YOLOv5提升了7.2个百分点,检测速度满足实时性要求。展开更多
现有的烟火检测方法主要依赖员工现场巡视,效率低且实时性差,因此,提出一种基于YOLOv5s的复杂场景下的高效烟火检测算法YOLOv5s-MRD(YOLOv5s-MPDIoU-RevCol-Dyhead)。首先,采用MPDIoU(Maximized Position-Dependent Intersection over U...现有的烟火检测方法主要依赖员工现场巡视,效率低且实时性差,因此,提出一种基于YOLOv5s的复杂场景下的高效烟火检测算法YOLOv5s-MRD(YOLOv5s-MPDIoU-RevCol-Dyhead)。首先,采用MPDIoU(Maximized Position-Dependent Intersection over Union)方法改进边框损失函数,以适应重叠或非重叠的边界框回归(BBR),从而提高BBR的准确性和效率;其次,利用可逆柱状结构RevCol(Reversible Column)网络模型思想重构YOLOv5s模型的主干网络,使它具有多柱状网络架构,并在模型的不同层之间加入可逆链接,从而最大限度地保持特征信息以提高网络的特征提取能力;最后,引入Dynamic head检测头,以统一尺度感知、空间感知和任务感知,从而在不额外增加计算开销的条件下显著提高目标检测头的准确性和有效性。实验结果表明:在DFS(Data of Fire and Smoke)数据集上,与原始YOLOv5s算法相比,所提算法的平均精度均值(mAP@0.5)提升了9.3%,预测准确率提升了6.6%,召回率提升了13.8%。可见,所提算法能满足当前烟火检测应用场景的要求。展开更多
针对实时行人检测场景存在遮挡、形态姿势不同的行人目标,YOLOv5模型对于这些目标检测有明显的漏检问题,提出一种像素差异度注意力机制(pixel difference attention,PDA),不同于传统的通道注意力机制用全局均值池化(global average pool...针对实时行人检测场景存在遮挡、形态姿势不同的行人目标,YOLOv5模型对于这些目标检测有明显的漏检问题,提出一种像素差异度注意力机制(pixel difference attention,PDA),不同于传统的通道注意力机制用全局均值池化(global average pooling,GAP)、全局最大值池化(global max pooling,GMP)来概括整张特征图的信息,全局池化将空间压缩成一个值来表征整个通道,造成了空间信息的流失,PDA将空间信息沿高和宽分别压缩,并将其分别与通道信息联系起来做注意力加权操作,同时提出一种新的通道描述指标表征通道信息,增强空间信息与通道信息的交互,使模型更容易关注到综合了空间和通道维度上的特征图的重要信息,在主干网络末端插入PDA后使模型平均精度(mean average precision,mAP)0.5提升了2.4个百分点,mAP0.5:0.95提升了4.4个百分点;针对实时检测场景的部署和检测速度要求模型拥有较少的参数量和计算量,因此提出了新的轻量化特征提取模块AC3代替原YOLOv5模型中的C3模块,该模块使插入PDA后的改进模型在精度仅仅损失0.2个百分点的情况下,参数量(parameters,Param.)减少了20%左右,浮点运算量(giga floating-point operations,GFLOPs)减少了30%左右。实验结果表明,最终的改进模型比YOLOv5s原模型在VOC行人数据集上mAP0.5提升了2.2个百分点,mAP0.5:0.95提升了3.1个百分点,且参数量减少了20%左右,浮点运算量减少了30%左右,在GTX1050上的检测速度(frames per second,FPS)提升了4。展开更多
文摘交通标志检测是自动驾驶系统、辅助驾驶系统(DAS)的重要组成部分,对行车安全具有重要意义。针对小目标交通标志检测时受光照、恶劣天气等因素影响而导致的检测精度低、漏检率高等问题,提出一种基于改进YOLOv5的小目标交通标志检测算法。首先,引入空间到深度卷积(SPD-Conv)对特征图进行下采样,有效避免小目标信息丢失,提高小目标敏感度。其次,基于加权双向特征金字塔网络(BiFPN)改进颈部网络,添加跨层连接以融合多尺度特征。之后,增加小目标检测层,增强小目标检测能力。最后,采用SIoU(Shape-aware Intersection over Union)损失函数,关注真实框与预测框的角度信息。实验结果表明,改进后的算法在中国交通标志检测数据集(CCTSDB2021)上的平均精度均值(mAP)达到83.5%,相较于原YOLOv5提升了7.2个百分点,检测速度满足实时性要求。
文摘现有的烟火检测方法主要依赖员工现场巡视,效率低且实时性差,因此,提出一种基于YOLOv5s的复杂场景下的高效烟火检测算法YOLOv5s-MRD(YOLOv5s-MPDIoU-RevCol-Dyhead)。首先,采用MPDIoU(Maximized Position-Dependent Intersection over Union)方法改进边框损失函数,以适应重叠或非重叠的边界框回归(BBR),从而提高BBR的准确性和效率;其次,利用可逆柱状结构RevCol(Reversible Column)网络模型思想重构YOLOv5s模型的主干网络,使它具有多柱状网络架构,并在模型的不同层之间加入可逆链接,从而最大限度地保持特征信息以提高网络的特征提取能力;最后,引入Dynamic head检测头,以统一尺度感知、空间感知和任务感知,从而在不额外增加计算开销的条件下显著提高目标检测头的准确性和有效性。实验结果表明:在DFS(Data of Fire and Smoke)数据集上,与原始YOLOv5s算法相比,所提算法的平均精度均值(mAP@0.5)提升了9.3%,预测准确率提升了6.6%,召回率提升了13.8%。可见,所提算法能满足当前烟火检测应用场景的要求。
文摘针对实时行人检测场景存在遮挡、形态姿势不同的行人目标,YOLOv5模型对于这些目标检测有明显的漏检问题,提出一种像素差异度注意力机制(pixel difference attention,PDA),不同于传统的通道注意力机制用全局均值池化(global average pooling,GAP)、全局最大值池化(global max pooling,GMP)来概括整张特征图的信息,全局池化将空间压缩成一个值来表征整个通道,造成了空间信息的流失,PDA将空间信息沿高和宽分别压缩,并将其分别与通道信息联系起来做注意力加权操作,同时提出一种新的通道描述指标表征通道信息,增强空间信息与通道信息的交互,使模型更容易关注到综合了空间和通道维度上的特征图的重要信息,在主干网络末端插入PDA后使模型平均精度(mean average precision,mAP)0.5提升了2.4个百分点,mAP0.5:0.95提升了4.4个百分点;针对实时检测场景的部署和检测速度要求模型拥有较少的参数量和计算量,因此提出了新的轻量化特征提取模块AC3代替原YOLOv5模型中的C3模块,该模块使插入PDA后的改进模型在精度仅仅损失0.2个百分点的情况下,参数量(parameters,Param.)减少了20%左右,浮点运算量(giga floating-point operations,GFLOPs)减少了30%左右。实验结果表明,最终的改进模型比YOLOv5s原模型在VOC行人数据集上mAP0.5提升了2.2个百分点,mAP0.5:0.95提升了3.1个百分点,且参数量减少了20%左右,浮点运算量减少了30%左右,在GTX1050上的检测速度(frames per second,FPS)提升了4。