文摘现有户外垃圾检测算法在特征提取方面没有充分考虑CNN(Convolutional Neural Network)和Transformer的优缺点,限制了网络的整体性能。文中提出了一种由CNN和Transformer组成的双分支融合网络检测算法。在编码阶段,基于CNN和Transformer的优点构建了双分支主干网络来对原始图像的特征信息进行提取。通过多尺度卷积模块和多尺度池化模块消除所提取特征信息在维度和语义上的差异,通过加强特征提取网络减少深层神经网络中细节信息的丢失。文中收集了6个类别的户外常见垃圾图片,建立了一个背景复杂的垃圾图片数据集来验证所提算法在户外垃圾检测识别任务上的性能。实验结果表明,相比最新目标检测算法,所提算法在该数据集上的平均准确率(mean Average Precision,mAP)提升约5%。为了验证所提算法的泛化性能,在华为垃圾分类挑战杯数据集上进行了泛化实验,实验结果表明,相比最新目标检测算法,所提算法的mAP提升了约2%。