期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
面向机器视觉的VVC帧内编码算法 被引量:1
1
作者 熊皓萱 徐媛媛 朱琨 《信号处理》 北大核心 2025年第2期350-358,共9页
近年来,随着计算机视觉在智能监控、自动驾驶等领域的广泛应用,越来越多视频不仅用于人类观看,还可直接由机器视觉算法进行自动分析。如何高效地面向机器视觉存储和传输此类视频成为新的挑战。然而,现有的视频编码标准,如最新的多功能... 近年来,随着计算机视觉在智能监控、自动驾驶等领域的广泛应用,越来越多视频不仅用于人类观看,还可直接由机器视觉算法进行自动分析。如何高效地面向机器视觉存储和传输此类视频成为新的挑战。然而,现有的视频编码标准,如最新的多功能视频编码(Versatile Video Coding,VVC/H.266),主要针对人眼视觉特性进行优化,未能充分考虑压缩对机器视觉任务的性能影响。为解决这一问题,本文以多目标跟踪作为典型的机器视觉视频处理任务,提出一种面向机器视觉的VVC帧内编码算法。首先,使用神经网络可解释性方法,梯度加权类激活映射(Gradient-weighted Class Activation Mapping,GradCAM++),对视频内容进行显著性分析,定位出机器视觉任务所关注的区域,并以显著图的形式表示。随后,为了突出视频画面中的关键边缘轮廓信息,本文引入边缘检测并将其结果与显著性分析结果进行融合,得到最终的机器视觉显著性图。最后,基于融合后的机器视觉显著性图改进VVC模式选择过程,优化VVC中的块划分和帧内预测的模式决策过程。通过引入机器视觉失真,代替原有的信号失真来调整率失真优化公式,使得编码器在压缩过程中尽可能保留对视觉任务更为相关的信息。实验结果表明,与VVC基准相比,所提出方法在保持相同机器视觉检测精度的同时,可节约12.7%的码率。 展开更多
关键词 机器视觉编码 显著性分析 帧内编码 多功能视频编码
在线阅读 下载PDF
一种基于图神经网络和统计分析的VVC帧内编码快速算法 被引量:1
2
作者 黎天送 刘昊坤 +3 位作者 崔少国 刘姝岑 陈艳 王鸿奎 《电信科学》 北大核心 2024年第9期109-122,共14页
多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式... 多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit,CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快速算法,该算法利用平均方向方差和Sobel梯度算子确定纹理方向,并跳过部分角度预测模式,同时结合预测模式间的相关性精简率失真模式列表。实验结果表明,该算法能够在BDBR(bjontegaard delta bit rate)上升2.29%的代价下,节省64.04%的编码时间。 展开更多
关键词 多功能视频编码 帧内编码 编码单元划分 帧内角度模式
在线阅读 下载PDF
应用于H.26X的通用无损帧内编码优化算法 被引量:7
3
作者 林敏 林庆毫 +1 位作者 翁晓雨 陈国捷 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2021年第8期125-131,共7页
在H.26X系列视频编码标准的无损压缩方案中,通过帧内预测得到的预测残差仍具有较强的空间相关性,直接参与熵编码将导致编码效率下降。与自然图像不同,帧内预测残差的空间相关性体现为含有丰富的边缘特征。为利用帧内预测残差特殊的空间... 在H.26X系列视频编码标准的无损压缩方案中,通过帧内预测得到的预测残差仍具有较强的空间相关性,直接参与熵编码将导致编码效率下降。与自然图像不同,帧内预测残差的空间相关性体现为含有丰富的边缘特征。为利用帧内预测残差特殊的空间相关性,进一步降低其空域冗余,提高视频帧内编码的效率,提出一种通用的基于残差中值边缘检测的无损帧内编码算法。算法首先对帧内预测残差逐点进行边缘检测,通过分析临近点的数值特征,使用中值边缘检测算法得到当前点的预测值;然后,对比预测值与原始残差值,得到新的预测残差;最后,为确保编码新的预测残差能够提高压缩率,依照当前编码单元的能量是否降低来快速判断是否使用新的残差进行熵编码。实验结果表明:经过该算法处理的编码单元具有更低的空域冗余和残差能量,从而可降低熵编码后的码率。经统计,在H.265与最新的H.266标准中应用提出的优化算法,帧内预测残差的能量平均降低67.9%,平均码率分别降低7.04%和5.98%,同时编解码时间变化细微,具有显著的实用价值。 展开更多
关键词 无损视频压缩 帧内编码 预测残差 高性能视频编码 多功能视频编码
在线阅读 下载PDF
针对VVC色度预测的注意力卷积神经网络算法 被引量:1
4
作者 王昂 何小海 +2 位作者 罗丹 熊淑华 陈洪刚 《电讯技术》 北大核心 2024年第11期1741-1749,共9页
针对多功能视频编码(Versatile Video Coding,VVC)标准中跨通道线性预测模型(Cross-Component Linear Model,CCLM)无法很好地拟合色度与亮度之间的非线性对应关系这一不足,提出了一种基于注意力机制卷积神经网络的VVC色度预测算法。该... 针对多功能视频编码(Versatile Video Coding,VVC)标准中跨通道线性预测模型(Cross-Component Linear Model,CCLM)无法很好地拟合色度与亮度之间的非线性对应关系这一不足,提出了一种基于注意力机制卷积神经网络的VVC色度预测算法。该算法主要思想是在进行色度预测时,使用对应亮度块的信息与待预测色度块上方与左方的信息作为参考信息输入进卷积神经网络,利用注意力机制对参考信息中的亮度与色度间的内在联系进行分配权重后输入预测网络。实验结果表明,相较于VVC标准算法U分量和V分量的平均码率节省分别为0.64%和0.68%,有效提升了VVC编码性能。 展开更多
关键词 多功能视频编码 帧内预测 注意力机制 卷积神经网络
在线阅读 下载PDF
基于VVC的多方向细化Merge模式优化算法
5
作者 唐健翔 熊淑华 +1 位作者 孙伟恒 何小海 《电子测量技术》 北大核心 2023年第10期189-196,共8页
针对多功能视频编码标准VVC帧间预测中,Merge模式未充分考虑运动存在的多种方向性从而降低了预测精度的问题,提出了一种基于VVC的多方向细化Merge模式优化算法。本算法在分析带运动矢量差的Merge技术的基础上,首先调整了步长选择范围并... 针对多功能视频编码标准VVC帧间预测中,Merge模式未充分考虑运动存在的多种方向性从而降低了预测精度的问题,提出了一种基于VVC的多方向细化Merge模式优化算法。本算法在分析带运动矢量差的Merge技术的基础上,首先调整了步长选择范围并增加多种搜索方向,然后根据步长自适应选择色度块的运动补偿方式,并最终根据率失真代价准则选择最优的运动矢量信息。实验结果表明,本文算法与VTM-12.0参考模型相比,在低延迟P帧配置下Y、U、V三分量的BD-rate分别平均下降了0.57%、0.62%、0.25%,在随机接入配置下的BD-rate中Y分量下降了0.27%、U分量仅提高了0.11%、V分量降低了0.04%,有效地提升了Merge模式的编码性能。 展开更多
关键词 多功能视频编码 帧间预测 多方向细化 Merge模式 编码性能
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部