现有目标检测算法对背景复杂下小交通标志的检测效果并不理想。为此,提出了一种基于归一化通道注意力机制YOLOv7的交通标志检测算法(YOLOv7 based on normalized channel attention mechanism,YOLOv7-NCAM)。为了使YOLOv7-NCAM模型具有...现有目标检测算法对背景复杂下小交通标志的检测效果并不理想。为此,提出了一种基于归一化通道注意力机制YOLOv7的交通标志检测算法(YOLOv7 based on normalized channel attention mechanism,YOLOv7-NCAM)。为了使YOLOv7-NCAM模型具有像素级建模能力,提高它对小目标交通标志特征的提取能力,YOLOv7-NCAM算法使用FReLU激活函数构建了DBF和CBF两种卷积层,并用它们来组建模型的Backbone模块和Neck模块;提出一种归一化通道注意力机制(normalized channel attention mechanism,NCAM)并加入Head模块中。通过与整体网络一起训练,得到归一化(batch normalization,BN)缩放因子,利用缩放因子算出各个通道的权重因子,提升网络对交通标志特征的表达能力,从而使YOLOv7-NCAM网络模型能够集中关注检测目标交通标志。通过在CCTSDB-2021交通标志检测数据集上的测试,与YOLOv7网络模型对比结果表明,YOLOv7-NCAM算法对背景复杂下小交通标志的检测各项指标均有明显提高:准确率(precision,P)达到91.5%,比原网络高出9.5个百分点;召回率(recall,R)达到85.9%,比原网络高出5.7个百分点;均值平均精度(mean average precision,mAP)达到了91.4%,比原网络高出4.7个百分点。与现有的交通标志检测算法相比,YOLOv7-NCAM算法的检测准确率也有提高,且检测速度48.3 FPS,能满足实时需求。展开更多
准确地识别农作物病害种类、病害程度,是能够正确防治病害的基础,对农作物的高质量生产有重要意义。针对传统深度学习模型对图像的细粒度分类不够精准的问题,提出不参与残差计算的通道注意力(efficient channel attention without parti...准确地识别农作物病害种类、病害程度,是能够正确防治病害的基础,对农作物的高质量生产有重要意义。针对传统深度学习模型对图像的细粒度分类不够精准的问题,提出不参与残差计算的通道注意力(efficient channel attention without participating in residual calculation,EWPRC)结构,该结构将改进的通道注意力机制ECANet3放在残差块之后,增加模型对通道维度的权重学习能力,并将EWPRC结构用于骨干网络为ResNet50的迁移学习模型中,通过替换模型中的layer3、layer4层得到了EWPRC-RseNet-t模型。试验使用了AIChallenger 2018数据集,在数据预处理、数据增强、超参数相同的情况下,首先对比了固定核大小为3、5、7、11、13的通道注意力机制对模型准确率的影响,在此试验中,模型的准确率随卷积核变大呈下降趋势,其中一维卷积核大小为3的模型准确率最高,达到了87.42%,比核大小为5、7、11、13的模型分别提高了0.03、0.42、0.51、0.64百分点。再将EWPRC-ResNet-t模型与经过微调的迁移学习模型ResNet-t以及GoogLeNet、MobileNet-v3、ResNet50模型进行对比,以准确率、精确率、召回率以及F1值作为评价指标,试验结果证明EWPRC-ResNet-t模型取得了最好的效果,比传统深度学习模型中准确率最高的ResNet50模型提高了0.99百分点,比ResNet-t模型提高了0.75百分点。且相比传统的深度学习模型,EWPRC-ResNet-t模型有更高的精度、召回率与F1得分。展开更多
文摘现有目标检测算法对背景复杂下小交通标志的检测效果并不理想。为此,提出了一种基于归一化通道注意力机制YOLOv7的交通标志检测算法(YOLOv7 based on normalized channel attention mechanism,YOLOv7-NCAM)。为了使YOLOv7-NCAM模型具有像素级建模能力,提高它对小目标交通标志特征的提取能力,YOLOv7-NCAM算法使用FReLU激活函数构建了DBF和CBF两种卷积层,并用它们来组建模型的Backbone模块和Neck模块;提出一种归一化通道注意力机制(normalized channel attention mechanism,NCAM)并加入Head模块中。通过与整体网络一起训练,得到归一化(batch normalization,BN)缩放因子,利用缩放因子算出各个通道的权重因子,提升网络对交通标志特征的表达能力,从而使YOLOv7-NCAM网络模型能够集中关注检测目标交通标志。通过在CCTSDB-2021交通标志检测数据集上的测试,与YOLOv7网络模型对比结果表明,YOLOv7-NCAM算法对背景复杂下小交通标志的检测各项指标均有明显提高:准确率(precision,P)达到91.5%,比原网络高出9.5个百分点;召回率(recall,R)达到85.9%,比原网络高出5.7个百分点;均值平均精度(mean average precision,mAP)达到了91.4%,比原网络高出4.7个百分点。与现有的交通标志检测算法相比,YOLOv7-NCAM算法的检测准确率也有提高,且检测速度48.3 FPS,能满足实时需求。
文摘准确地识别农作物病害种类、病害程度,是能够正确防治病害的基础,对农作物的高质量生产有重要意义。针对传统深度学习模型对图像的细粒度分类不够精准的问题,提出不参与残差计算的通道注意力(efficient channel attention without participating in residual calculation,EWPRC)结构,该结构将改进的通道注意力机制ECANet3放在残差块之后,增加模型对通道维度的权重学习能力,并将EWPRC结构用于骨干网络为ResNet50的迁移学习模型中,通过替换模型中的layer3、layer4层得到了EWPRC-RseNet-t模型。试验使用了AIChallenger 2018数据集,在数据预处理、数据增强、超参数相同的情况下,首先对比了固定核大小为3、5、7、11、13的通道注意力机制对模型准确率的影响,在此试验中,模型的准确率随卷积核变大呈下降趋势,其中一维卷积核大小为3的模型准确率最高,达到了87.42%,比核大小为5、7、11、13的模型分别提高了0.03、0.42、0.51、0.64百分点。再将EWPRC-ResNet-t模型与经过微调的迁移学习模型ResNet-t以及GoogLeNet、MobileNet-v3、ResNet50模型进行对比,以准确率、精确率、召回率以及F1值作为评价指标,试验结果证明EWPRC-ResNet-t模型取得了最好的效果,比传统深度学习模型中准确率最高的ResNet50模型提高了0.99百分点,比ResNet-t模型提高了0.75百分点。且相比传统的深度学习模型,EWPRC-ResNet-t模型有更高的精度、召回率与F1得分。