期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
轻量级目标检测算法综述
被引量:
3
1
作者
叶栢铖
朱尤攀
+4 位作者
周永康
段晨昊
张昱东
陶志刚
傅志宇
《红外技术》
北大核心
2025年第3期289-298,共10页
传统基于深度学习的目标检测算法通常需要巨大的计算资源和长时间的训练,不能满足工业界的需求。轻量级目标检测网络通过牺牲一部分检测精度,换取更快的推理速度和更轻量的模型,适用于边缘计算设备中的应用,受到了广泛关注。本文介绍了...
传统基于深度学习的目标检测算法通常需要巨大的计算资源和长时间的训练,不能满足工业界的需求。轻量级目标检测网络通过牺牲一部分检测精度,换取更快的推理速度和更轻量的模型,适用于边缘计算设备中的应用,受到了广泛关注。本文介绍了常用于压缩和加速模型轻量化技术,归类分析了轻量化骨干网络结构原理,并在YOLOv5s上进行实际效果对比。最后对轻量化目标检测算法的未来前景以及面临的挑战进行了展望。
展开更多
关键词
深度学习
目标检测
轻量化技术
骨干网络
在线阅读
下载PDF
职称材料
基于ViT语义指导与结构感知增强的艺术风格迁移
2
作者
潘书煜
赵征鹏
+3 位作者
阳秋霞
普园媛
谷金晶
徐丹
《计算机学报》
北大核心
2025年第9期2131-2158,共28页
艺术风格迁移是计算机视觉领域一个长期的研究热点,该任务旨在将参考风格图像的艺术风格迁移到内容图像中,同时保持内容图像的语义结构不变。目前基于深度学习的艺术风格迁移方法依然面临一项主要挑战:现有方法在迁移过程中无法很好地...
艺术风格迁移是计算机视觉领域一个长期的研究热点,该任务旨在将参考风格图像的艺术风格迁移到内容图像中,同时保持内容图像的语义结构不变。目前基于深度学习的艺术风格迁移方法依然面临一项主要挑战:现有方法在迁移过程中无法很好地保持内容域到风格域的语义结构跨域一致性,从而导致风格化结果的内容保真度低、风格化不一致。针对以上问题,本文提出了一种基于ViT(Vision Transformer)语义指导与结构感知增强的艺术风格迁移方法。首先,利用预训练的DINO-ViT模型在内容域和风格域建立强大且一致的内容结构表示,并设计了两种损失函数:(1)DINO keys自相似性的语义结构损失,以保持内容源的跨域一致性;(2)DINO特征空间的知识蒸馏损失,以提升编码器的特征提取能力。其次,为进一步增强模型的结构感知能力,提出了基于拉普拉斯算子的空间结构损失和基于小波变换的频域纹理损失,从空间域和频率域两方面增强了对边缘轮廓与细致纹理的约束。在通用数据集MS COCO和WikiArt上的定性与定量结果表明,本文方法不仅可以产生内容保真度高、风格化一致的结果,还能推广应用于现有方法以进一步改善生成结果的视觉质量。其中,与基线方法CAP-VST相比,本文方法的SSIM值提升0.079,CLIP-IQA值提升0.024,LPIPS值小0.096,Content Loss值小1.035;将本文方法应用于其他现有方法后,SSIM值最优提升0.135,CLIP-IQA值最优提升0.011,LPIPS值最优小0.108,Content Loss值最优小1.244,证明了本文方法在艺术风格迁移任务中的有效性与灵活性。
展开更多
关键词
艺术风格迁移
Vision
Transformer
知识蒸馏
结构感知
拉普拉斯算子
小波变换
在线阅读
下载PDF
职称材料
题名
轻量级目标检测算法综述
被引量:
3
1
作者
叶栢铖
朱尤攀
周永康
段晨昊
张昱东
陶志刚
傅志宇
机构
昆明物理研究所
云南省微光夜视探测及智能视觉导航重点实验室
北京理工大学生命学院
北方光电仪器有限公司
出处
《红外技术》
北大核心
2025年第3期289-298,共10页
文摘
传统基于深度学习的目标检测算法通常需要巨大的计算资源和长时间的训练,不能满足工业界的需求。轻量级目标检测网络通过牺牲一部分检测精度,换取更快的推理速度和更轻量的模型,适用于边缘计算设备中的应用,受到了广泛关注。本文介绍了常用于压缩和加速模型轻量化技术,归类分析了轻量化骨干网络结构原理,并在YOLOv5s上进行实际效果对比。最后对轻量化目标检测算法的未来前景以及面临的挑战进行了展望。
关键词
深度学习
目标检测
轻量化技术
骨干网络
Keywords
deep learning
target detection
lightweight technology
backbone network
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于ViT语义指导与结构感知增强的艺术风格迁移
2
作者
潘书煜
赵征鹏
阳秋霞
普园媛
谷金晶
徐丹
机构
云南
大学信息学院
云南省微光夜视探测及智能视觉导航重点实验室
云南省
高校物联网技术及应用
重点
实验室
出处
《计算机学报》
北大核心
2025年第9期2131-2158,共28页
基金
国家自然科学基金地区项目(62362070,61761046)
国家自然科学基金面上项目(61271361)
+4 种基金
云南省科技厅科技计划基础研究专项-重点项目(202401AS070149)
云南省应用基础研究计划资助项目重点项目(202001BB050043)
云南省微光夜视探测及智能视觉导航重点实验室(202449CE340004)
云南大学第三届专业学位研究生实践创新项目(ZC-23235984)
云南大学第十五届研究生科研创新项目(KC-23235986)资助。
文摘
艺术风格迁移是计算机视觉领域一个长期的研究热点,该任务旨在将参考风格图像的艺术风格迁移到内容图像中,同时保持内容图像的语义结构不变。目前基于深度学习的艺术风格迁移方法依然面临一项主要挑战:现有方法在迁移过程中无法很好地保持内容域到风格域的语义结构跨域一致性,从而导致风格化结果的内容保真度低、风格化不一致。针对以上问题,本文提出了一种基于ViT(Vision Transformer)语义指导与结构感知增强的艺术风格迁移方法。首先,利用预训练的DINO-ViT模型在内容域和风格域建立强大且一致的内容结构表示,并设计了两种损失函数:(1)DINO keys自相似性的语义结构损失,以保持内容源的跨域一致性;(2)DINO特征空间的知识蒸馏损失,以提升编码器的特征提取能力。其次,为进一步增强模型的结构感知能力,提出了基于拉普拉斯算子的空间结构损失和基于小波变换的频域纹理损失,从空间域和频率域两方面增强了对边缘轮廓与细致纹理的约束。在通用数据集MS COCO和WikiArt上的定性与定量结果表明,本文方法不仅可以产生内容保真度高、风格化一致的结果,还能推广应用于现有方法以进一步改善生成结果的视觉质量。其中,与基线方法CAP-VST相比,本文方法的SSIM值提升0.079,CLIP-IQA值提升0.024,LPIPS值小0.096,Content Loss值小1.035;将本文方法应用于其他现有方法后,SSIM值最优提升0.135,CLIP-IQA值最优提升0.011,LPIPS值最优小0.108,Content Loss值最优小1.244,证明了本文方法在艺术风格迁移任务中的有效性与灵活性。
关键词
艺术风格迁移
Vision
Transformer
知识蒸馏
结构感知
拉普拉斯算子
小波变换
Keywords
artistic style transfer
Vision Transformer
knowledge distillation
structure-awareness
Laplacian operator
wavelet transform
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
轻量级目标检测算法综述
叶栢铖
朱尤攀
周永康
段晨昊
张昱东
陶志刚
傅志宇
《红外技术》
北大核心
2025
3
在线阅读
下载PDF
职称材料
2
基于ViT语义指导与结构感知增强的艺术风格迁移
潘书煜
赵征鹏
阳秋霞
普园媛
谷金晶
徐丹
《计算机学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部