针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature an...针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。展开更多
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s...针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。展开更多
为了解决遥感道路提取中边缘细节特征利用不充分,以及复杂背景遮挡区域的道路难以实现准确分割等问题,提出一种基于边缘引导和多尺度感知的遥感道路提取模型(Edge-guidance and Multi-scale perception U-Net,EMUNet)。以U-Net为基础,...为了解决遥感道路提取中边缘细节特征利用不充分,以及复杂背景遮挡区域的道路难以实现准确分割等问题,提出一种基于边缘引导和多尺度感知的遥感道路提取模型(Edge-guidance and Multi-scale perception U-Net,EMUNet)。以U-Net为基础,增加遥感图像的Canny边缘检测结果作为输入,并通过设计结合注意力的边缘引导融合模块对各层编码器进行特征引导,以此充分利用边缘信息提高最终的道路提取质量;其次,针对图像中存在的背景遮挡问题,通过构建多尺度并行空洞卷积模块增强网络的多尺度感知能力,从而捕获更多的上下文信息,对一些受到背景遮挡的区域实现准确提取。在Massachusetts道路数据集上进行实验验证,与U-Net相比,EMUNet能实现对细小道路和受遮挡区域更准确的分割,并且召回率、F1分数和交并比均优于其他对比算法,能够实现更为完整和准确的道路信息提取。展开更多
文摘针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。
文摘针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。
文摘为了解决遥感道路提取中边缘细节特征利用不充分,以及复杂背景遮挡区域的道路难以实现准确分割等问题,提出一种基于边缘引导和多尺度感知的遥感道路提取模型(Edge-guidance and Multi-scale perception U-Net,EMUNet)。以U-Net为基础,增加遥感图像的Canny边缘检测结果作为输入,并通过设计结合注意力的边缘引导融合模块对各层编码器进行特征引导,以此充分利用边缘信息提高最终的道路提取质量;其次,针对图像中存在的背景遮挡问题,通过构建多尺度并行空洞卷积模块增强网络的多尺度感知能力,从而捕获更多的上下文信息,对一些受到背景遮挡的区域实现准确提取。在Massachusetts道路数据集上进行实验验证,与U-Net相比,EMUNet能实现对细小道路和受遮挡区域更准确的分割,并且召回率、F1分数和交并比均优于其他对比算法,能够实现更为完整和准确的道路信息提取。