-
题名基于无标签视频数据的深度预测学习方法综述
被引量:5
- 1
-
-
作者
潘敏婷
王韫博
朱祥明
高思宇
龙明盛
杨小康
-
机构
上海交通大学人工智能研究院、人工智能教育部重点实验室
清华大学软件学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2022年第4期869-886,共18页
-
基金
国家自然科学基金(No.62106144,No.U19B2035)
上海市科技重大专项(No.2021SHZDZX0102)
上海市青年科技英才扬帆计划(No.21Z510202133)。
-
文摘
基于视频数据的深度预测学习(以下简称“深度预测学习”)属于深度学习、计算机视觉和强化学习的交叉融合研究方向,是气象预报、自动驾驶、机器人视觉控制等场景下智能预测与决策系统的关键组成部分,在近年来成为机器学习的热点研究领域.深度预测学习遵从自监督学习范式,从无标签的视频数据中挖掘自身的监督信息,学习其潜在的时空模式表达.本文对基于深度学习的视频预测现有研究成果进行了详细综述.首先,归纳了深度预测学习的研究范畴和交叉应用领域.其次,总结了视频预测研究中常用的数据集和评价指标.而后,从基于观测空间的视频预测、基于状态空间的视频预测、有模型的视觉决策三个角度,分类对比了当前主流的深度预测学习模型.最后,本文分析了深度预测学习领域的热点问题,并对研究趋势进行了展望.
-
关键词
深度学习
自监督学习
计算机视觉
视频预测
有模型的视觉决策
-
Keywords
deep learning
self-supervised learning
computer vision
video prediction
model-based visual planning
-
分类号
TP389.1
[自动化与计算机技术—计算机系统结构]
-