多波段图像目标检测识别是重要的多模态基础任务之一,旨在通过不同传感器的成像特性补充完善目标特征来提高目标感知效果,对提升交通、医疗、军事等领域智能化程度具有重要的现实意义。针对目标检测识别中广泛存在的因光照、遮挡、复杂...多波段图像目标检测识别是重要的多模态基础任务之一,旨在通过不同传感器的成像特性补充完善目标特征来提高目标感知效果,对提升交通、医疗、军事等领域智能化程度具有重要的现实意义。针对目标检测识别中广泛存在的因光照、遮挡、复杂背景导致的检测识别效果不佳的问题,提出一种动态自适应聚合的可见光红外图像目标检测识别方法。通过设计通道注意力混合和二次动态权重连接的动态聚合结构以及语义空间信息交互的多路径扩展Neck结构,充分挖掘多波段图像的互补性,来提升困难场景下多波段图像目标融合检测的平均准确率。经公开数据集测试,相较于不采用动态聚合结构和多路径扩展Neck结构的对比模型,该方法的平均准确率(mean Average Precision,mAP)提高4个百分点以上。展开更多
文摘多波段图像目标检测识别是重要的多模态基础任务之一,旨在通过不同传感器的成像特性补充完善目标特征来提高目标感知效果,对提升交通、医疗、军事等领域智能化程度具有重要的现实意义。针对目标检测识别中广泛存在的因光照、遮挡、复杂背景导致的检测识别效果不佳的问题,提出一种动态自适应聚合的可见光红外图像目标检测识别方法。通过设计通道注意力混合和二次动态权重连接的动态聚合结构以及语义空间信息交互的多路径扩展Neck结构,充分挖掘多波段图像的互补性,来提升困难场景下多波段图像目标融合检测的平均准确率。经公开数据集测试,相较于不采用动态聚合结构和多路径扩展Neck结构的对比模型,该方法的平均准确率(mean Average Precision,mAP)提高4个百分点以上。