-
题名视觉表征学习综述
- 1
-
-
作者
王帅炜
雷杰
冯尊磊
梁荣华
-
机构
浙江工业大学计算机科学与技术学院
浙江大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第11期112-132,共21页
-
基金
国家自然科学基金(62106226,62036009)
浙江省自然科学基金(LQ22F020013,LDT23F0202)。
-
文摘
表征学习是人工智能算法中的重要一环,好的表征能够让后续的下游任务事半功倍。随着深度学习在计算机视觉领域的发展,视觉表征学习变得越来越重要,其目的是将复杂的视觉信息转换为更易于人工智能算法学习的表达。文中主要介绍了目前广泛使用的视觉表征学习的研究工作,根据数据依赖程度和类型的不同,将其划分为预训练视觉表征学习、生成式视觉表征学习、对比式视觉表征学习、解耦式视觉表征学习以及结合语言信息的视觉表征学习。具体而言,预训练视觉表征学习是基于有监督的预训练模型在视觉表征学习上的应用;生成式视觉表征学习利用生成模型学习视觉表征;对比式视觉表征学习主要介绍了利用对比学习思想来学习视觉表征的各类网络框架。此外,还介绍了利用变分自编码器和生成对抗网络在解耦式视觉表征学习中的应用,以及利用语言信息来增强视觉表征学习的各种方法。最后,总结了视觉表征学习的评价准则和未来展望。
-
关键词
视觉表征学习
人工智能算法
解耦式视觉表征学习
语言信息
-
Keywords
Visual representation learning
Artificial intelligence algorithm
Decoupled visual representation learning
Language information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-