针对安全帽检测任务中存在的目标面积小、目标被不同程度遮挡、复杂背景干扰目标等问题,提出了基于YOLOX的多感受野增强的安全帽检测算法(multiple receptive field enhancement-YOLOX,MRFE-YOLOX)。在特征融合网络中增加浅层特征融合分...针对安全帽检测任务中存在的目标面积小、目标被不同程度遮挡、复杂背景干扰目标等问题,提出了基于YOLOX的多感受野增强的安全帽检测算法(multiple receptive field enhancement-YOLOX,MRFE-YOLOX)。在特征融合网络中增加浅层特征融合分支,提升小目标特征信息流通效率,提高了小目标的检测精度;设计基于空洞卷积组与卷积注意力机制的感受野增强模块(receptive field augmentation module,RFAM),捕获了更大范围的感受野和图像特征,改善了遮挡目标漏检率高的问题;根据三分支注意力机制构建特征增强网络(feature enhancement network,FENet),抑制背景噪音对目标区域的干扰,降低了复杂背景下的目标误检率;引入空间到深度卷积(space to depth-conv,SPD-Conv)得到无信息损失的二倍下采样特征图,保留了更多的特征信息,同时减少了模型的参数量。实验结果表明,所提算法的均值平均精度相较于基线算法提升了2.78个百分点,FPS达到了102.67,满足了爆破现场安全帽实时检测的需要。展开更多
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s...针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。展开更多
从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(conce...从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以innerMPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。展开更多
文摘针对安全帽检测任务中存在的目标面积小、目标被不同程度遮挡、复杂背景干扰目标等问题,提出了基于YOLOX的多感受野增强的安全帽检测算法(multiple receptive field enhancement-YOLOX,MRFE-YOLOX)。在特征融合网络中增加浅层特征融合分支,提升小目标特征信息流通效率,提高了小目标的检测精度;设计基于空洞卷积组与卷积注意力机制的感受野增强模块(receptive field augmentation module,RFAM),捕获了更大范围的感受野和图像特征,改善了遮挡目标漏检率高的问题;根据三分支注意力机制构建特征增强网络(feature enhancement network,FENet),抑制背景噪音对目标区域的干扰,降低了复杂背景下的目标误检率;引入空间到深度卷积(space to depth-conv,SPD-Conv)得到无信息损失的二倍下采样特征图,保留了更多的特征信息,同时减少了模型的参数量。实验结果表明,所提算法的均值平均精度相较于基线算法提升了2.78个百分点,FPS达到了102.67,满足了爆破现场安全帽实时检测的需要。
文摘针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。
文摘从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以innerMPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。