期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
轻量级目标检测算法综述 被引量:3
1
作者 叶栢铖 朱尤攀 +4 位作者 周永康 段晨昊 张昱东 陶志刚 傅志宇 《红外技术》 北大核心 2025年第3期289-298,共10页
传统基于深度学习的目标检测算法通常需要巨大的计算资源和长时间的训练,不能满足工业界的需求。轻量级目标检测网络通过牺牲一部分检测精度,换取更快的推理速度和更轻量的模型,适用于边缘计算设备中的应用,受到了广泛关注。本文介绍了... 传统基于深度学习的目标检测算法通常需要巨大的计算资源和长时间的训练,不能满足工业界的需求。轻量级目标检测网络通过牺牲一部分检测精度,换取更快的推理速度和更轻量的模型,适用于边缘计算设备中的应用,受到了广泛关注。本文介绍了常用于压缩和加速模型轻量化技术,归类分析了轻量化骨干网络结构原理,并在YOLOv5s上进行实际效果对比。最后对轻量化目标检测算法的未来前景以及面临的挑战进行了展望。 展开更多
关键词 深度学习 目标检测 轻量化技术 骨干网络
在线阅读 下载PDF
基于ViT语义指导与结构感知增强的艺术风格迁移
2
作者 潘书煜 赵征鹏 +3 位作者 阳秋霞 普园媛 谷金晶 徐丹 《计算机学报》 北大核心 2025年第9期2131-2158,共28页
艺术风格迁移是计算机视觉领域一个长期的研究热点,该任务旨在将参考风格图像的艺术风格迁移到内容图像中,同时保持内容图像的语义结构不变。目前基于深度学习的艺术风格迁移方法依然面临一项主要挑战:现有方法在迁移过程中无法很好地... 艺术风格迁移是计算机视觉领域一个长期的研究热点,该任务旨在将参考风格图像的艺术风格迁移到内容图像中,同时保持内容图像的语义结构不变。目前基于深度学习的艺术风格迁移方法依然面临一项主要挑战:现有方法在迁移过程中无法很好地保持内容域到风格域的语义结构跨域一致性,从而导致风格化结果的内容保真度低、风格化不一致。针对以上问题,本文提出了一种基于ViT(Vision Transformer)语义指导与结构感知增强的艺术风格迁移方法。首先,利用预训练的DINO-ViT模型在内容域和风格域建立强大且一致的内容结构表示,并设计了两种损失函数:(1)DINO keys自相似性的语义结构损失,以保持内容源的跨域一致性;(2)DINO特征空间的知识蒸馏损失,以提升编码器的特征提取能力。其次,为进一步增强模型的结构感知能力,提出了基于拉普拉斯算子的空间结构损失和基于小波变换的频域纹理损失,从空间域和频率域两方面增强了对边缘轮廓与细致纹理的约束。在通用数据集MS COCO和WikiArt上的定性与定量结果表明,本文方法不仅可以产生内容保真度高、风格化一致的结果,还能推广应用于现有方法以进一步改善生成结果的视觉质量。其中,与基线方法CAP-VST相比,本文方法的SSIM值提升0.079,CLIP-IQA值提升0.024,LPIPS值小0.096,Content Loss值小1.035;将本文方法应用于其他现有方法后,SSIM值最优提升0.135,CLIP-IQA值最优提升0.011,LPIPS值最优小0.108,Content Loss值最优小1.244,证明了本文方法在艺术风格迁移任务中的有效性与灵活性。 展开更多
关键词 艺术风格迁移 Vision Transformer 知识蒸馏 结构感知 拉普拉斯算子 小波变换
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部