期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于对比学习的数据高效视频检索
1
作者 凌非 余京涛 +4 位作者 朱哲燕 罗剑 朱继祥 陈先客 董建锋 《图学学报》 北大核心 2025年第3期491-501,共11页
视频检索系统的性能很大程度上依赖标注数据,而在提高性能的同时减少对高昂手工标注的依赖是一个关键问题。为此,提出了一种基于对比学习的数据高效视频检索方法,包括2个关键的优化策略。首先,为构建更加多样且有效的学习数据,提出了基... 视频检索系统的性能很大程度上依赖标注数据,而在提高性能的同时减少对高昂手工标注的依赖是一个关键问题。为此,提出了一种基于对比学习的数据高效视频检索方法,包括2个关键的优化策略。首先,为构建更加多样且有效的学习数据,提出了基于内容感知的特征级别数据增强,利用基于帧间相似度的K-近邻算法来捕获深层语义信息,减少标注数据依赖。其次,设计了长-短动态采样策略,通过从视频中提取长片段及其内部短片段,使其能够构造具有多尺度信息的正样本对以进行更加有效的对比学习,同时通过动态调整采样长度来提高数据利用率。在SVD和UCF101数据集上的实验结果表明,该方法显著优于现有检索模型。大量消融实验证明,基于内容感知的特征级数据增强能提升模型适应性;长-短动态采样不仅适用于自监督学习,还能提升半监督模型性能。 展开更多
关键词 对比学习 内容感知 特征增强 视频检索 视频表征学习
在线阅读 下载PDF
跨视图时序对比学习的自监督视频表征算法
2
作者 王露露 徐增敏 +2 位作者 张雪莲 蒙儒省 卢涛 《计算机工程与应用》 CSCD 北大核心 2024年第18期158-166,共9页
现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用。为此提出基于跨视图语义一致性的时序对比学习算法,... 现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用。为此提出基于跨视图语义一致性的时序对比学习算法,自监督学习RGB帧和光流场两种数据中蕴含的动作时序变化特性,主要思路为:设计局部时序对比学习方法,采用不同正负样本划分策略,挖掘同一实例不重叠片段之间的时序相关性和判别可分性,增强细粒度特征表达能力;研究全局对比学习方法,通过跨视图语义协同训练来增加正样本,学习多实例不同视图的语义一致性,提高模型的泛化能力。通过两个下游任务对模型效果进行评估,在UCF101和HMDB51数据集的实验结果表明,所提方法在动作识别和视频检索任务上,较前沿主流方法平均提升了2~3.5个百分点。 展开更多
关键词 自监督学习 视频表征学习 时序对比学习 局部对比学习 跨视图协同
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部