目标检测是遥感影像解译当中最重要的任务之一。当前,基于深度学习的遥感目标检测模型大多依赖于预定义的锚框,且往往忽略了场景中的上下文信息,导致检测性能和泛化能力受限。基于此,本文提出了一种面向遥感影像目标检测的场景关联无锚...目标检测是遥感影像解译当中最重要的任务之一。当前,基于深度学习的遥感目标检测模型大多依赖于预定义的锚框,且往往忽略了场景中的上下文信息,导致检测性能和泛化能力受限。基于此,本文提出了一种面向遥感影像目标检测的场景关联无锚框YOLO网络(Scene Related Anchor-Free YOLO,SRAF-YOLO)。SRAF-YOLO首先引入了一种场景增强的多尺度特征提取模块,通过将场景特征与目标特征融合,生成富含场景上下文信息的场景增强特征,并进一步利用多尺度操作提取包含场景语义的多尺度特征,有效引入场景上下文信息。在此基础上,设计了一种场景辅助无锚框检测头,利用特征图中的场景信息对目标类别预测进行约束,以提升检测精度,同时无锚框结构有效减少了锚框相关参数的计算量。在RSOD和NWPU VHR-10数据集上的实验结果表明,SRAF-YOLO通过融合场景信息和无锚框机制提升了目标检测精度,平均精度均值(mAP)分别达到94.58%和95.95%,相较于基线模型YOLOv8分别提升了1.51%和3.0%,并优于其他对比方法。在外部数据集上的验证结果进一步证实,该算法具备良好的泛化能力。展开更多
文摘目标检测是遥感影像解译当中最重要的任务之一。当前,基于深度学习的遥感目标检测模型大多依赖于预定义的锚框,且往往忽略了场景中的上下文信息,导致检测性能和泛化能力受限。基于此,本文提出了一种面向遥感影像目标检测的场景关联无锚框YOLO网络(Scene Related Anchor-Free YOLO,SRAF-YOLO)。SRAF-YOLO首先引入了一种场景增强的多尺度特征提取模块,通过将场景特征与目标特征融合,生成富含场景上下文信息的场景增强特征,并进一步利用多尺度操作提取包含场景语义的多尺度特征,有效引入场景上下文信息。在此基础上,设计了一种场景辅助无锚框检测头,利用特征图中的场景信息对目标类别预测进行约束,以提升检测精度,同时无锚框结构有效减少了锚框相关参数的计算量。在RSOD和NWPU VHR-10数据集上的实验结果表明,SRAF-YOLO通过融合场景信息和无锚框机制提升了目标检测精度,平均精度均值(mAP)分别达到94.58%和95.95%,相较于基线模型YOLOv8分别提升了1.51%和3.0%,并优于其他对比方法。在外部数据集上的验证结果进一步证实,该算法具备良好的泛化能力。
文摘针对遥感图像中大纵横比目标因正样本不足而出现的学习不充分问题,提出一种基于形状自适应标签分配的遥感有向目标检测网络(shape-adaptive label assignment for oriented object detection network,SALANet)。首先,引入纵横比敏感系数建立目标几何特征与正样本数量的动态映射关系,缓解传统方法中固定分配规则引发的样本分布不平衡问题;其次,设计自适应标签分配策略,通过对交并比(intersection over union,IoU)进行排名实现高质量正样本选择;最后,提出中心轴先验,将圆形中心先验区扩展为目标中心轴的矩形区域,增强大纵横比目标的几何特征表征能力。在DOTAv1.0和HRSC2016数据集上的对比实验表明,SALANet分别取得0.777 1和0.932 3的平均精度均值(mean average precision,mAP),较基线方法RoI Transformer分别提升8.15%和2.87%。
文摘随着自动驾驶的发展,多传感器融合得到广泛应用。CLOCs是基于后融合的3D目标检测网络,但它对遮蔽物体的检测性能较差。针对此问题,提出一种融合双目测距和门控循环单元(Gated Recurrent Unit,GRU)的3D目标检测网络,其在CLOCs网络融合3D和2D的交并比(Intersection over Union,IoU)的基础上,在2D目标检测网络中引入双目测距来关联2D和3D的深度信息,在卷积之后加入GRU网络,用来捕捉时序数据的依赖关系。采用kitti数据集进行验证,实验结果表明检测精度得到了提升。