检索结果-维普期刊中文期刊服务平台

面向机器视觉的VVC帧内编码算法被引量：1: 1; 作者熊皓萱徐媛媛朱琨《信号处理》北大核心 2025年第2期350-358,共9页; 近年来,随着计算机视觉在智能监控、自动驾驶等领域的广泛应用,越来越多视频不仅用于人类观看,还可直接由机器视觉算法进行自动分析。如何高效地面向机器视觉存储和传输此类视频成为新的挑战。然而,现有的视频编码标准,如最新的多功能... 展开更多; 关键词机器视觉编码显著性分析帧内编码多功能视频编码; 在线阅读下载PDF 职称材料

一种基于图神经网络和统计分析的VVC帧内编码快速算法被引量：1: 2; 作者黎天送刘昊坤 +3 位作者崔少国刘姝岑陈艳王鸿奎《电信科学》北大核心 2024年第9期109-122,共14页; 多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式... 展开更多; 关键词多功能视频编码帧内编码编码单元划分帧内角度模式; 在线阅读下载PDF 职称材料

应用于H.26X的通用无损帧内编码优化算法被引量：7: 3; 作者林敏林庆毫 +1 位作者翁晓雨陈国捷《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2021年第8期125-131,共7页; 在H.26X系列视频编码标准的无损压缩方案中,通过帧内预测得到的预测残差仍具有较强的空间相关性,直接参与熵编码将导致编码效率下降。与自然图像不同,帧内预测残差的空间相关性体现为含有丰富的边缘特征。为利用帧内预测残差特殊的空间... 展开更多; 关键词无损视频压缩帧内编码预测残差高性能视频编码多功能视频编码; 在线阅读下载PDF 职称材料

针对VVC色度预测的注意力卷积神经网络算法被引量：1: 4; 作者王昂何小海 +2 位作者罗丹熊淑华陈洪刚《电讯技术》北大核心 2024年第11期1741-1749,共9页; 针对多功能视频编码(Versatile Video Coding,VVC)标准中跨通道线性预测模型(Cross-Component Linear Model,CCLM)无法很好地拟合色度与亮度之间的非线性对应关系这一不足,提出了一种基于注意力机制卷积神经网络的VVC色度预测算法。该... 展开更多; 关键词多功能视频编码帧内预测注意力机制卷积神经网络; 在线阅读下载PDF 职称材料

基于VVC的多方向细化Merge模式优化算法: 5; 作者唐健翔熊淑华 +1 位作者孙伟恒何小海《电子测量技术》北大核心 2023年第10期189-196,共8页; 针对多功能视频编码标准VVC帧间预测中,Merge模式未充分考虑运动存在的多种方向性从而降低了预测精度的问题,提出了一种基于VVC的多方向细化Merge模式优化算法。本算法在分析带运动矢量差的Merge技术的基础上,首先调整了步长选择范围并... 展开更多; 关键词多功能视频编码帧间预测多方向细化 Merge模式编码性能; 在线阅读下载PDF 职称材料

题名面向机器视觉的VVC帧内编码算法被引量：1: 1; 作者熊皓萱徐媛媛朱琨; 机构河海大学计算机与软件学院南京航空航天大学计算机科学与技术学院; 出处《信号处理》北大核心 2025年第2期350-358,共9页; 基金国家自然科学基金(62061146002)。; 文摘近年来,随着计算机视觉在智能监控、自动驾驶等领域的广泛应用,越来越多视频不仅用于人类观看,还可直接由机器视觉算法进行自动分析。如何高效地面向机器视觉存储和传输此类视频成为新的挑战。然而,现有的视频编码标准,如最新的多功能视频编码(Versatile Video Coding,VVC/H.266),主要针对人眼视觉特性进行优化,未能充分考虑压缩对机器视觉任务的性能影响。为解决这一问题,本文以多目标跟踪作为典型的机器视觉视频处理任务,提出一种面向机器视觉的VVC帧内编码算法。首先,使用神经网络可解释性方法,梯度加权类激活映射(Gradient-weighted Class Activation Mapping,GradCAM++),对视频内容进行显著性分析,定位出机器视觉任务所关注的区域,并以显著图的形式表示。随后,为了突出视频画面中的关键边缘轮廓信息,本文引入边缘检测并将其结果与显著性分析结果进行融合,得到最终的机器视觉显著性图。最后,基于融合后的机器视觉显著性图改进VVC模式选择过程,优化VVC中的块划分和帧内预测的模式决策过程。通过引入机器视觉失真,代替原有的信号失真来调整率失真优化公式,使得编码器在压缩过程中尽可能保留对视觉任务更为相关的信息。实验结果表明,与VVC基准相比,所提出方法在保持相同机器视觉检测精度的同时,可节约12.7%的码率。; 关键词机器视觉编码显著性分析帧内编码多功能视频编码; Keywords video coding for machines saliency analysis intra-coding Versatile Video Coding/H.266; 分类号 TP37 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名一种基于图神经网络和统计分析的VVC帧内编码快速算法被引量：1: 2; 作者黎天送刘昊坤崔少国刘姝岑陈艳王鸿奎; 机构重庆师范大学杭州电子科技大学; 出处《电信科学》北大核心 2024年第9期109-122,共14页; 基金重庆市科技局自然基金项目(No.CSTB2022NSCQ-MSX1231) 重庆市教委青年项目(No.KJQN202200519) 重庆师范大学人才基金项目(No.21XLB031)。; 文摘多功能视频编码(versatile video coding,VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree,QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit,CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快速算法,该算法利用平均方向方差和Sobel梯度算子确定纹理方向,并跳过部分角度预测模式,同时结合预测模式间的相关性精简率失真模式列表。实验结果表明,该算法能够在BDBR(bjontegaard delta bit rate)上升2.29%的代价下,节省64.04%的编码时间。; 关键词多功能视频编码帧内编码编码单元划分帧内角度模式; Keywords VVC intra coding coding unit partition intra-angel mode; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名应用于H.26X的通用无损帧内编码优化算法被引量：7: 3; 作者林敏林庆毫翁晓雨陈国捷; 机构特种光纤与光接入网重点实验室(上海大学); 出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2021年第8期125-131,共7页; 基金国家重点研发计划(2019YFB2204500)。; 文摘在H.26X系列视频编码标准的无损压缩方案中,通过帧内预测得到的预测残差仍具有较强的空间相关性,直接参与熵编码将导致编码效率下降。与自然图像不同,帧内预测残差的空间相关性体现为含有丰富的边缘特征。为利用帧内预测残差特殊的空间相关性,进一步降低其空域冗余,提高视频帧内编码的效率,提出一种通用的基于残差中值边缘检测的无损帧内编码算法。算法首先对帧内预测残差逐点进行边缘检测,通过分析临近点的数值特征,使用中值边缘检测算法得到当前点的预测值;然后,对比预测值与原始残差值,得到新的预测残差;最后,为确保编码新的预测残差能够提高压缩率,依照当前编码单元的能量是否降低来快速判断是否使用新的残差进行熵编码。实验结果表明:经过该算法处理的编码单元具有更低的空域冗余和残差能量,从而可降低熵编码后的码率。经统计,在H.265与最新的H.266标准中应用提出的优化算法,帧内预测残差的能量平均降低67.9%,平均码率分别降低7.04%和5.98%,同时编解码时间变化细微,具有显著的实用价值。; 关键词无损视频压缩帧内编码预测残差高性能视频编码多功能视频编码; Keywords lossless video compression intra-frame coding prediction residuals high efficiency video coding(HEVC) versatile video coding(VVC); 分类号 TN919.81 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名针对VVC色度预测的注意力卷积神经网络算法被引量：1: 4; 作者王昂何小海罗丹熊淑华陈洪刚; 机构四川大学电子信息学院; 出处《电讯技术》北大核心 2024年第11期1741-1749,共9页; 基金国家自然科学基金资助项目(62271336,62211530110) 四川省国际科技创新合作项目(2024YFHZ0289) TCL科技创新基金。; 文摘针对多功能视频编码(Versatile Video Coding,VVC)标准中跨通道线性预测模型(Cross-Component Linear Model,CCLM)无法很好地拟合色度与亮度之间的非线性对应关系这一不足,提出了一种基于注意力机制卷积神经网络的VVC色度预测算法。该算法主要思想是在进行色度预测时,使用对应亮度块的信息与待预测色度块上方与左方的信息作为参考信息输入进卷积神经网络,利用注意力机制对参考信息中的亮度与色度间的内在联系进行分配权重后输入预测网络。实验结果表明,相较于VVC标准算法U分量和V分量的平均码率节省分别为0.64%和0.68%,有效提升了VVC编码性能。; 关键词多功能视频编码帧内预测注意力机制卷积神经网络; Keywords versatile video coding intra-frame prediction attention mechanism convolutional neural network; 分类号 TN919.81 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名基于VVC的多方向细化Merge模式优化算法: 5; 作者唐健翔熊淑华孙伟恒何小海; 机构四川大学电子信息学院; 出处《电子测量技术》北大核心 2023年第10期189-196,共8页; 基金国家自然科学基金(61871279,62211530110)项目资助。; 文摘针对多功能视频编码标准VVC帧间预测中,Merge模式未充分考虑运动存在的多种方向性从而降低了预测精度的问题,提出了一种基于VVC的多方向细化Merge模式优化算法。本算法在分析带运动矢量差的Merge技术的基础上,首先调整了步长选择范围并增加多种搜索方向,然后根据步长自适应选择色度块的运动补偿方式,并最终根据率失真代价准则选择最优的运动矢量信息。实验结果表明,本文算法与VTM-12.0参考模型相比,在低延迟P帧配置下Y、U、V三分量的BD-rate分别平均下降了0.57%、0.62%、0.25%,在随机接入配置下的BD-rate中Y分量下降了0.27%、U分量仅提高了0.11%、V分量降低了0.04%,有效地提升了Merge模式的编码性能。; 关键词多功能视频编码帧间预测多方向细化 Merge模式编码性能; Keywords versatile video coding inter prediction multi-direction refinement Merge mode the coding performance; 分类号 TN919.81 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	面向机器视觉的VVC帧内编码算法	熊皓萱徐媛媛朱琨	《信号处理》北大核心	2025	1	在线阅读下载PDF 职称材料
2	一种基于图神经网络和统计分析的VVC帧内编码快速算法	黎天送刘昊坤崔少国刘姝岑陈艳王鸿奎	《电信科学》北大核心	2024	1	在线阅读下载PDF 职称材料
3	应用于H.26X的通用无损帧内编码优化算法	林敏林庆毫翁晓雨陈国捷	《哈尔滨工业大学学报》 EI CAS CSCD 北大核心	2021	7	在线阅读下载PDF 职称材料
4	针对VVC色度预测的注意力卷积神经网络算法	王昂何小海罗丹熊淑华陈洪刚	《电讯技术》北大核心	2024	1	在线阅读下载PDF 职称材料
5	基于VVC的多方向细化Merge模式优化算法	唐健翔熊淑华孙伟恒何小海	《电子测量技术》北大核心	2023	0	在线阅读下载PDF 职称材料