传统CNN算法在花生荚果外观识别任务中存在内存密集型和计算密集型问题,以及其在资源受限的边缘终端上部署困难,基于此,该研究提出了一种高效的花生荚果识别模型——PPINET(peanut pod identification network),以适应嵌入式设备的资源...传统CNN算法在花生荚果外观识别任务中存在内存密集型和计算密集型问题,以及其在资源受限的边缘终端上部署困难,基于此,该研究提出了一种高效的花生荚果识别模型——PPINET(peanut pod identification network),以适应嵌入式设备的资源限制需求。该模型通过结合深度可分离卷积和倒残差结构显著降低参数量和计算量,同时保留特征提取能力,并引入MQA(multi-query attention)模块增强关键特征提取,并利用TuNAS(easy-to-tune and scalable implementation of efficient neural architecture search with weight sharing)策略优化模型结构,使其在资源受限设备上表现优异。此外,采用ResNet(residual neural network)进行知识蒸馏配合三折交叉验证训练提升精度,最终量化为RKNN格式并在瑞芯微RK3588上实现NPU加速部署。PPINET模型尺寸仅为1.85 MB,参数量为0.49 M,浮点运算数为0.30G。PPINET在花生荚果分类中表现优异,准确率达98.65%,在RK3588上推理速度达321 fps。该模型具备较高的识别准确率和快速的识别速度,能够实现花生荚果的实时精准检测。展开更多
经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式...经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式,减少了冗余参数量,加快了计算速度并有效地减少了模型的内存占用量,从而提高了算法去雾效率;同时采用多尺度结构在不同尺度上对雾图进行分析和处理,更好地捕捉图像的细节信息,提升了网络对图像细节的处理能力,解决了原算法去雾时存在的细节模糊问题;最后在网络结构中加入金字塔池化模块,用于整合图像不同区域的上下文信息,扩展了网络的感知范围,从而提高网络模型获取有雾图像全局信息的能力,进而改善图像色调失真、细节丢失等问题。此外,引入一个低照度增强模块,通过明确预测噪声实现去噪的目标,从而恢复曝光不足的图像。在低光去雾图像中,峰值信噪比(PSNR)和结构相似性(SSIM)指标均有显著提升,处理后的图片具有更高的整体自然度。实验结果表明:与经典AOD-Net去雾的结果相比,改进算法能够更好地恢复图像的细节和结构,使得去雾后的图像更自然,饱和度和对比度也更加平衡;在RESIDE的SOTS数据集中的室外和室内场景,相较于经典AOD-Net,改进算法的PSNR分别提升了4.5593 dB和4.0656 dB,SSIM分别提升了0.0476和0.0874。展开更多
为提升弹载成像制导中运动模糊图像目标检测的精确性与效率,提出一种轻量化且高效的运动模糊图像目标检测(Lighter and More Effective Motion-blurred Image Object Detection,LEMBD)网络。通过深入分析运动模糊图像的成因,基于成像机...为提升弹载成像制导中运动模糊图像目标检测的精确性与效率,提出一种轻量化且高效的运动模糊图像目标检测(Lighter and More Effective Motion-blurred Image Object Detection,LEMBD)网络。通过深入分析运动模糊图像的成因,基于成像机理构建了专用的运动模糊图像数据集。在不增加网络参数的前提下,采用共享权重的孪生网络设计,并引入先验知识,将清晰图像的特征学习用于模糊图像的特征提取,以同时实现对清晰与模糊图像的精准检测。此外,设计了部分深度可分离卷积替代普通卷积,显著减少了网络的参数量与计算量,并提升了学习性能。为进一步优化特征融合质量,提出跨层路径聚合特征金字塔网络,有效利用低级特征的细节信息和高级特征的语义信息。实验结果表明,所提LEMBD网络在运动模糊图像目标检测任务中的性能优于传统目标检测方法和主流运动模糊检测算法,能够为精确制导任务提供更精准的目标相对位置信息。展开更多
文摘经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式,减少了冗余参数量,加快了计算速度并有效地减少了模型的内存占用量,从而提高了算法去雾效率;同时采用多尺度结构在不同尺度上对雾图进行分析和处理,更好地捕捉图像的细节信息,提升了网络对图像细节的处理能力,解决了原算法去雾时存在的细节模糊问题;最后在网络结构中加入金字塔池化模块,用于整合图像不同区域的上下文信息,扩展了网络的感知范围,从而提高网络模型获取有雾图像全局信息的能力,进而改善图像色调失真、细节丢失等问题。此外,引入一个低照度增强模块,通过明确预测噪声实现去噪的目标,从而恢复曝光不足的图像。在低光去雾图像中,峰值信噪比(PSNR)和结构相似性(SSIM)指标均有显著提升,处理后的图片具有更高的整体自然度。实验结果表明:与经典AOD-Net去雾的结果相比,改进算法能够更好地恢复图像的细节和结构,使得去雾后的图像更自然,饱和度和对比度也更加平衡;在RESIDE的SOTS数据集中的室外和室内场景,相较于经典AOD-Net,改进算法的PSNR分别提升了4.5593 dB和4.0656 dB,SSIM分别提升了0.0476和0.0874。
文摘为提升弹载成像制导中运动模糊图像目标检测的精确性与效率,提出一种轻量化且高效的运动模糊图像目标检测(Lighter and More Effective Motion-blurred Image Object Detection,LEMBD)网络。通过深入分析运动模糊图像的成因,基于成像机理构建了专用的运动模糊图像数据集。在不增加网络参数的前提下,采用共享权重的孪生网络设计,并引入先验知识,将清晰图像的特征学习用于模糊图像的特征提取,以同时实现对清晰与模糊图像的精准检测。此外,设计了部分深度可分离卷积替代普通卷积,显著减少了网络的参数量与计算量,并提升了学习性能。为进一步优化特征融合质量,提出跨层路径聚合特征金字塔网络,有效利用低级特征的细节信息和高级特征的语义信息。实验结果表明,所提LEMBD网络在运动模糊图像目标检测任务中的性能优于传统目标检测方法和主流运动模糊检测算法,能够为精确制导任务提供更精准的目标相对位置信息。