目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求。提出一种可以额外预测害虫状态信息的融合MAE和YOLOX算法的高速高精度农...目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求。提出一种可以额外预测害虫状态信息的融合MAE和YOLOX算法的高速高精度农田害虫检测模型MRA-YOLOX(masked autoencoders and rapid aim detection-exceeding YOLO)。算法构建包含近4万张图片以及5万余标注的数据集TDBFP(target detection dataset be used for farmland pests),TDBFP数据集标注了10种害虫的生长状态、物种类别以及位置,以便更好地把握害虫信息,从而更准确地制定对策。修改YOLOX模型的解耦头及loss,额外输出生长状态,以改进模型预测更多信息;将ECA(efficient channel attention)和SA(shuffle attention)注意力机制进行有机融合,并插入backbone与FPN(feature pyr-amid networks)的连接过程以及FPN的通道堆叠过程,以便能够增强获得全局信息和丰富上下文信息的能力,从而取得比单一注意力机制更好的效果;将MAE中自监督解码器部分插入YOLOX的数据增强部分,扩大感受野,增强识别细粒度,获得超越mixup和mosaic的数据增强效果。实验结果表明,当需要同时感知目标的状态、分类和位置时,MRA-YOLOX相较于原始YOLOX模型对于TDBFP数据集的检测精度mAP@0.5由60.1%上升到88.2%,平均检测准确率提高了18.8个百分点,且检测帧率达到145 FPS,可以用于更复杂的工程实践。展开更多
文摘目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求。提出一种可以额外预测害虫状态信息的融合MAE和YOLOX算法的高速高精度农田害虫检测模型MRA-YOLOX(masked autoencoders and rapid aim detection-exceeding YOLO)。算法构建包含近4万张图片以及5万余标注的数据集TDBFP(target detection dataset be used for farmland pests),TDBFP数据集标注了10种害虫的生长状态、物种类别以及位置,以便更好地把握害虫信息,从而更准确地制定对策。修改YOLOX模型的解耦头及loss,额外输出生长状态,以改进模型预测更多信息;将ECA(efficient channel attention)和SA(shuffle attention)注意力机制进行有机融合,并插入backbone与FPN(feature pyr-amid networks)的连接过程以及FPN的通道堆叠过程,以便能够增强获得全局信息和丰富上下文信息的能力,从而取得比单一注意力机制更好的效果;将MAE中自监督解码器部分插入YOLOX的数据增强部分,扩大感受野,增强识别细粒度,获得超越mixup和mosaic的数据增强效果。实验结果表明,当需要同时感知目标的状态、分类和位置时,MRA-YOLOX相较于原始YOLOX模型对于TDBFP数据集的检测精度mAP@0.5由60.1%上升到88.2%,平均检测准确率提高了18.8个百分点,且检测帧率达到145 FPS,可以用于更复杂的工程实践。