-
题名低码率生成式无人机视频编码算法
- 1
-
-
作者
刘美琴
陈虹宇
周一鸣
倪文昊
-
机构
北京交通大学信息科学研究所
北京交通大学视觉智能交叉创新教育部国际合作联合实验室
-
出处
《数据采集与处理》
北大核心
2025年第2期320-333,共14页
-
基金
国家自然科学基金(62372036)。
-
文摘
空天地海复杂环境下海量的视频数据给有限的传输带宽和存储设备带来了巨大的压力,因此如何提高视频编码技术在低码率条件下的编码效率显得尤为关键。近年来,基于深度学习的视频编码算法取得了良好的进展,却因优化目标与感知质量失配、训练数据分布偏差等问题,降低了极低码率下的视觉感知质量。生成式编码通过学习数据分布有效提升了低码率下的纹理与结构复原能力,缓解了深度视频压缩的模糊伪影问题。然而,现有研究仍存在两大瓶颈:一是时域相关性建模不足,帧间关联缺失;二是动态比特分配机制欠缺,难以实现关键信息的自适应提取。为此,提出一种基于条件引导扩散模型的视频编码算法(Conditional guided diffusion modelvideo compression,CGDMVC),旨在改善低码率条件下视频感知质量的同时,加强帧间特征建模能力和保留关键信息。具体地,该算法设计了隐式帧间对齐策略,利用扩散模型捕获帧间潜在特征,降低估计显式运动信息的计算复杂度。同时,设计的自适应时空重要性编码器可动态分配码率优化关键区域的生成质量。此外,引入感知损失函数,结合感知图像块相似度(Learned perceptual image patch similarity,LPIPS)约束,以提高重建帧的视觉保真度。实验结果表明,与DCVC(Deep contextual video compression)等算法相比,该算法在低码率(<0.1 BPP)情况下,LPIPS值平均降低了36.49%,展现出更丰富的纹理细节和更自然的视觉效果。
-
关键词
视频编码
扩散模型
感知质量
帧间对齐
低码率
-
Keywords
video compression
diffusion model
perceptual quality
inter-frame alignment
low bit rate
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度学习的视频超分辨率重建算法进展
- 2
-
-
作者
唐麒
赵耀
刘美琴
姚超
-
机构
北京交通大学信息科学研究所
北京交通大学视觉智能交叉创新教育部国际合作联合实验室
北京科技大学计算机与通信工程学院
-
出处
《自动化学报》
北大核心
2025年第7期1480-1524,共45页
-
基金
中央高校基本科研业务费专项资金(2024JBZX001)
国家自然科学基金(62120106009,62332017,62372036)资助。
-
文摘
视频超分辨率重建是底层计算机视觉任务中的一个重要研究方向,旨在利用低分辨率视频的帧内和帧间信息,重建具有更多细节和内容一致的高分辨率视频,有助于提升下游任务性能和改善用户观感体验.近年来,基于深度学习的视频超分辨率重建算法大量涌现,在帧间对齐、信息传播等方面取得突破性的进展.首先,在简述视频超分辨率重建任务的基础上,梳理现有的视频超分辨率重建的公共数据集及相关算法;接着,详细综述基于深度学习的视频超分辨率重建算法的创新性工作进展情况;最后,总结视频超分辨率重建算法面临的挑战及未来的发展趋势.
-
关键词
视频超分辨率重建
深度学习
循环神经网络
注意力机制
光流估计
可变形卷积
-
Keywords
Video super-resolution
deep learning
recurrent neural network
attention mechanism
optical flow es-timation
deformable convolution
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名梯度引导的JPEG压缩图像超分辨率重建
- 3
-
-
作者
曹坪
林树冉
张淳杰
郑晓龙
赵耀
-
机构
北京交通大学计算机科学与技术学院信息科学研究所
北京交通大学视觉智能交叉创新教育部国际合作联合实验室
中国科学院自动化研究所多模态人工智能系统全国重点实验室
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
中国科学院大学
-
出处
《自动化学报》
北大核心
2025年第6期1261-1276,共16页
-
基金
国家自然科学基金(62476021,72225011,72434005,62072026)
多模态人工智能系统全国重点实验室开放课题基金(MAIS2024106)资助。
-
文摘
在真实场景中,图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响.现有方法通常聚焦于单一退化类型,难以应对复杂的复合退化情况.为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题,提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络.该网络以超分辨率分支为主导,融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征,实现了高质量图像重建.JPEG压缩伪影去除分支专注于压缩伪影抑制,缓解了主导分支的重建负担.梯度引导分支则精准估计图像梯度,引导主导分支恢复更多细节与纹理.实验结果表明,该方法提升了低分辨率JPEG压缩图像的重建质量.
-
关键词
JPEG压缩
超分辨率
图像重建
梯度先验
-
Keywords
JPEG compression
super-resolution
image reconstruction
gradient prior
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于扰动响应的自适应集成黑盒对抗攻击算法
- 4
-
-
作者
冯卫栋
余东
张淳杰
郑晓龙
-
机构
北京交通大学计算机科学与技术学院信息科学研究所
北京交通大学视觉智能交叉创新教育部国际合作联合实验室
中国科学院自动化研究所多模态人工智能系统全国重点实验室
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
中国科学院大学
-
出处
《自动化学报》
北大核心
2025年第8期1788-1799,共12页
-
基金
国家自然科学基金(62476021,72225011,72434005,62072026)
多模态人工智能系统全国重点实验室开放课题基金(MAIS2024106)资助。
-
文摘
模型集成对抗攻击通过整合多个替代模型的梯度信息,能够显著增强对抗样本的跨模型迁移能力,是当前黑盒攻击中最具潜力的策略之一.然而,现有集成方法在动态加权过程中通常依赖扰动引起的预测误差作为权重依据,未能有效区分扰动作用与模型自身固有误差.由此可能高估低质量模型对扰动优化的贡献,干扰攻击方向,进而削弱对抗样本的实际迁移效果.鉴于此,提出基于扰动响应的自适应集成黑盒对抗攻击算法.首先,提出扰动响应感知的权重分配策略,通过引入KL散度与集成相似度指标来衡量扰动对模型输出的真实影响,避免低质量模型对集成过程的干扰;其次,提出梯度协同扰动缩放策略,结合像素级梯度一致性度量,动态调整扰动幅度,缓解集成过程中的局部过拟合现象,增强对抗样本在多模型间的泛化能力;最后,在多个黑盒攻击任务中进行综合评估,实验结果表明所提出的基于扰动响应的自适应集成黑盒对抗攻击算法在迁移性能、攻击成功率与扰动效率方面均显著优于现有方法.
-
关键词
对抗样本
集成攻击
梯度
黑盒模型
-
Keywords
Adversarial example
ensemble attack
gradient
black-box model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-