传统的三维感知任务是获取二维目标特征和复杂的深度测距信息,通过线性变换和几何处理得到三维目标信息。为了有效提高目标检测的准确性,提出了基于多级注意力机制与全局统筹信息融合(multi-level attention mechanism and global overa...传统的三维感知任务是获取二维目标特征和复杂的深度测距信息,通过线性变换和几何处理得到三维目标信息。为了有效提高目标检测的准确性,提出了基于多级注意力机制与全局统筹信息融合(multi-level attention mechanism and global overall information fusion,MAMGOIF)的三维目标检测方法。首先,在轻量级ResNet-50网络的基础上,与卷积操作和全连接操作相结合,用于提取多尺度图像特征信息;其次,利用多级注意力机制网络对多尺度局部信息进行自适应融合和增强通道信息;再次,构建全局信息融合网络,用于学习鸟瞰图(bird's-eye view,BEV)图像特征,通过卷积层获得三维目标信息;最后,将所提出的方法在公开的三维目标检测数据集nuScenes上进行实验。结果表明,提出的MAMGOIF模型比现有主流目标检测算法具有更好的性能。展开更多
文摘传统的三维感知任务是获取二维目标特征和复杂的深度测距信息,通过线性变换和几何处理得到三维目标信息。为了有效提高目标检测的准确性,提出了基于多级注意力机制与全局统筹信息融合(multi-level attention mechanism and global overall information fusion,MAMGOIF)的三维目标检测方法。首先,在轻量级ResNet-50网络的基础上,与卷积操作和全连接操作相结合,用于提取多尺度图像特征信息;其次,利用多级注意力机制网络对多尺度局部信息进行自适应融合和增强通道信息;再次,构建全局信息融合网络,用于学习鸟瞰图(bird's-eye view,BEV)图像特征,通过卷积层获得三维目标信息;最后,将所提出的方法在公开的三维目标检测数据集nuScenes上进行实验。结果表明,提出的MAMGOIF模型比现有主流目标检测算法具有更好的性能。