期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于事件及考虑像素级模糊程度的图像去模糊 被引量:2
1
作者 葛城轩 朱尊杰 +4 位作者 陆鸣 张文豪 路荣丰 王国相 郑博仑 《信号处理》 北大核心 2025年第2期312-324,共13页
在图像去模糊任务中,现有的端到端深度学习方法通常使用共享的卷积核来处理图像的整体空间位置,即使用的卷积核在整个图像的所有位置上都是相同的,不会根据具体位置的不同而改变。这意味着这些方法在处理图像时,无论图像中某个区域的模... 在图像去模糊任务中,现有的端到端深度学习方法通常使用共享的卷积核来处理图像的整体空间位置,即使用的卷积核在整个图像的所有位置上都是相同的,不会根据具体位置的不同而改变。这意味着这些方法在处理图像时,无论图像中某个区域的模糊程度如何,都使用相同的卷积核进行处理。然而,在某些复杂的模糊场景中,使用共享卷积核可能无法很好地处理图像的非均匀模糊情况。为此,本文提出了一种创新方法,利用像素级模糊程度来增强端到端图像去模糊的效果。具体来说,本文设计并训练了一个去模糊网络(Deblurring Network,DeblurNet),能够从输入图像和曝光时间内的事件数据中精确估计模糊程度图。随后,本文通过基于模糊程度的特征调制(Degree-based Feature Modulation,DFM)技术,依据模糊程度图自适应调节DeblurNet的特征。DeblurNet是一个端到端卷积神经网络,专门用于复原模糊图像的清晰度,通过动态卷积核来处理不同模糊程度的区域。这一策略实现了对非均匀模糊的空间可变卷积,从而有效地去除图像中的非均匀模糊。本文在合成数据集和真实事件数据集上进行了大量实验,并使用公开方法作为DeblurNet的基线。结果表明,提出的方法能够在合成和真实数据集上持续提升现有方法的性能,展示出较好的泛化能力。 展开更多
关键词 图像运动去模糊 事件相机 模糊度 特征调制
在线阅读 下载PDF
视觉语言预训练综述 被引量:14
2
作者 殷炯 张哲东 +5 位作者 高宇涵 杨智文 李亮 肖芒 孙垚棋 颜成钢 《软件学报》 EI CSCD 北大核心 2023年第5期2000-2023,共24页
近年来深度学习在计算机视觉(CV)和自然语言处理(NLP)等单模态领域都取得了十分优异的性能.随着技术的发展,多模态学习的重要性和必要性已经慢慢展现.视觉语言学习作为多模态学习的重要部分,得到国内外研究人员的广泛关注.得益于Transfo... 近年来深度学习在计算机视觉(CV)和自然语言处理(NLP)等单模态领域都取得了十分优异的性能.随着技术的发展,多模态学习的重要性和必要性已经慢慢展现.视觉语言学习作为多模态学习的重要部分,得到国内外研究人员的广泛关注.得益于Transformer框架的发展,越来越多的预训练模型被运用到视觉语言多模态学习上,相关任务在性能上得到了质的飞跃.系统地梳理了当前视觉语言预训练模型相关的工作,首先介绍了预训练模型的相关知识,其次从两种不同的角度分析比较预训练模型结构,讨论了常用的视觉语言预训练技术,详细介绍了5类下游预训练任务,最后介绍了常用的图像和视频预训练任务的数据集,并比较和分析了常用预训练模型在不同任务下不同数据集上的性能. 展开更多
关键词 多模态学习 预训练模型 TRANSFORMER 视觉语言学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部