-
题名跨域和跨模态适应学习的无监督细粒度视频分类
被引量:4
- 1
-
-
作者
何相腾
彭宇新
-
机构
北京大学王选计算机研究所
-
出处
《软件学报》
EI
CSCD
北大核心
2021年第11期3482-3495,共14页
-
基金
国家自然科学基金(61925201,61771025)。
-
文摘
细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将细粒度图像分类中学习到的知识自适应地迁移到细粒度视频分类中.然而,来源不同的图像和视频之间存在着域差异和模态差异,这导致细粒度图像分类的模型不能直接应用于细粒度视频分类.为了实现无监督的细粒度视频分类,提出一种无监督辨识适应网络,能够将辨识性定位能力从细粒度图像分类迁移到细粒度视频分类.进一步,提出一种渐进式伪标签策略来迭代地引导无监督辨识适应网络学习目标域视频的数据分布.在CUB-200-2011、Cars-196图像数据集和YouTube Birds、YouTube Cars视频数据集上验证该方法跨域、跨模态的适应能力,实验结果证明了该方法在无监督细粒度视频分类上的优势.
-
关键词
细粒度视频分类
无监督辨识适应网络
域差异
模态差异
域适应
-
Keywords
fine-grained video categorization
unsupervised discriminative adaptation network
domain distinction
modality distinction
domain adaption
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-