针对水下图像标注数据稀缺导致增强算法泛化性不足的问题,本文提出一种基于均值教师(Mean-Teacher)模型的半监督水下图像增强框架。设计融合光照和梯度先验的多尺度网络(Illumination and Gradient Prior network,IGP-Net)作为均值教师...针对水下图像标注数据稀缺导致增强算法泛化性不足的问题,本文提出一种基于均值教师(Mean-Teacher)模型的半监督水下图像增强框架。设计融合光照和梯度先验的多尺度网络(Illumination and Gradient Prior network,IGP-Net)作为均值教师模型的主干网络。IGP-Net包括以下3个模块:多尺度照明感知模块MSLP,用来提取退化图像的多尺度特征,并融合光照和梯度先验,提升水下图像对比度;多通道细节增强模块MCE,对初步增强图像进行通道维拆分和颜色补偿,改善水下图像颜色失真现象;并行注意力模块PC,利用像素注意力和通道注意力进一步关注照明信息和颜色信息之间的关联性,实现色彩均衡。在公开数据集上的定量比较和定性分析表明,本文所提方法在多个关键指标上优于现有先进算法。此外,在水下目标检测任务中的实验,也表明了经本文算法增强后的图像能够有效提升水下目标检测的性能。展开更多
针对在厢式货车中的弱光环境下,对自动装箱系统的箱体识别精度低的问题,提出一种基于优化的Kindling the Darkness(KinD)网络与You Only Look Once 11(YOLO 11)目标检测的视觉识别方法。对KinD网络进行结构优化,引入双边滤波降噪和Sobe...针对在厢式货车中的弱光环境下,对自动装箱系统的箱体识别精度低的问题,提出一种基于优化的Kindling the Darkness(KinD)网络与You Only Look Once 11(YOLO 11)目标检测的视觉识别方法。对KinD网络进行结构优化,引入双边滤波降噪和Sobel边缘增强模块,实现图像亮度与细节的有效提升;通过YOLO 11算法检测瓦楞纸箱,进行三维定位与姿态估计。结果表明,优化的KinD网络经图像增强后,平均峰值信噪比达到15.04 dB,结构相似性指数为0.72,图像处理时间为0.338 s;YOLO 11算法对增强图像的目标检测匹配度达到完全匹配26.7%、高匹配42.7%,整体平均位置误差归一化值为0.0143。研究为物流行业的自动装卸工作提供技术支撑。展开更多
文摘针对水下图像标注数据稀缺导致增强算法泛化性不足的问题,本文提出一种基于均值教师(Mean-Teacher)模型的半监督水下图像增强框架。设计融合光照和梯度先验的多尺度网络(Illumination and Gradient Prior network,IGP-Net)作为均值教师模型的主干网络。IGP-Net包括以下3个模块:多尺度照明感知模块MSLP,用来提取退化图像的多尺度特征,并融合光照和梯度先验,提升水下图像对比度;多通道细节增强模块MCE,对初步增强图像进行通道维拆分和颜色补偿,改善水下图像颜色失真现象;并行注意力模块PC,利用像素注意力和通道注意力进一步关注照明信息和颜色信息之间的关联性,实现色彩均衡。在公开数据集上的定量比较和定性分析表明,本文所提方法在多个关键指标上优于现有先进算法。此外,在水下目标检测任务中的实验,也表明了经本文算法增强后的图像能够有效提升水下目标检测的性能。
文摘针对在厢式货车中的弱光环境下,对自动装箱系统的箱体识别精度低的问题,提出一种基于优化的Kindling the Darkness(KinD)网络与You Only Look Once 11(YOLO 11)目标检测的视觉识别方法。对KinD网络进行结构优化,引入双边滤波降噪和Sobel边缘增强模块,实现图像亮度与细节的有效提升;通过YOLO 11算法检测瓦楞纸箱,进行三维定位与姿态估计。结果表明,优化的KinD网络经图像增强后,平均峰值信噪比达到15.04 dB,结构相似性指数为0.72,图像处理时间为0.338 s;YOLO 11算法对增强图像的目标检测匹配度达到完全匹配26.7%、高匹配42.7%,整体平均位置误差归一化值为0.0143。研究为物流行业的自动装卸工作提供技术支撑。