针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature an...针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。展开更多
目前网购平台的搜索对象仍以文字为主,致使搜索效率低下。文章以广受女性欢迎的浅口高跟鞋为例,对利用图片进行款式自动识别的技术进行探索。以网购平台上收集的3类浅口高跟鞋(粗跟、细跟、坡跟)共900张图片(每款随机抽取200张作为训练...目前网购平台的搜索对象仍以文字为主,致使搜索效率低下。文章以广受女性欢迎的浅口高跟鞋为例,对利用图片进行款式自动识别的技术进行探索。以网购平台上收集的3类浅口高跟鞋(粗跟、细跟、坡跟)共900张图片(每款随机抽取200张作为训练集,剩余100张作为测试集)为研究对象,然后利用深度学习中的Faster R CNN检测模型对浅口高跟鞋款式进行训练和测试识别。结果表明:无论以鞋跟为目标区域,还是以整只鞋为检测区域,利用该模型都能对浅口高跟鞋图像实现良好的款式识别,准确率可达94%以上,且不用经过人为特征提取,方便可行;Faster R CNN检测模型的总体精度和检测速度比R CNN、SPP-Net、FAST R CNN更优。展开更多
文摘针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。
文摘目前网购平台的搜索对象仍以文字为主,致使搜索效率低下。文章以广受女性欢迎的浅口高跟鞋为例,对利用图片进行款式自动识别的技术进行探索。以网购平台上收集的3类浅口高跟鞋(粗跟、细跟、坡跟)共900张图片(每款随机抽取200张作为训练集,剩余100张作为测试集)为研究对象,然后利用深度学习中的Faster R CNN检测模型对浅口高跟鞋款式进行训练和测试识别。结果表明:无论以鞋跟为目标区域,还是以整只鞋为检测区域,利用该模型都能对浅口高跟鞋图像实现良好的款式识别,准确率可达94%以上,且不用经过人为特征提取,方便可行;Faster R CNN检测模型的总体精度和检测速度比R CNN、SPP-Net、FAST R CNN更优。