-
题名空间混洗与链式残差增强的轻量级视频人群计数
- 1
-
-
作者
陈永
张娇娇
周方春
-
机构
兰州交通大学电子与信息工程学院
甘肃省人工智能与图形图像处理工程研究中心
-
出处
《北京航空航天大学学报》
北大核心
2025年第2期397-408,共12页
-
基金
国家自然科学基金(62462043,61963023)
兰州交通大学重点研发项目(ZDYF2304)。
-
文摘
针对现有视频人群计数方法网络模型复杂度高、精确度和实时性差的问题,提出了一种空间混洗与链式残差增强的轻量级视频人群计数方法。所提模型由多尺度深度可分离反向卷积编码器、尺度回归解码器和预测输出层构成。在编码器部分,设计多尺度深度可分离反向残差块,提取不同分辨率的人群特征及相邻帧之间的时域特征信息,提高模型的轻量化程度;提出空间混洗模块嵌入到编码骨干网络中,增强不同尺度人群特征提取能力。在解码器部分,改进多分辨率融合模块及链式残差模块,对编码器输出的不同分辨率特征逐层聚合,减少细节特征丢失。通过解码器预测输出,得到回归人群密度图,并通过对密度图逐像素求和输出计数结果。所提方法在Mall、UCSD、FDST、ShanghaiTech等人群视频数据集上进行对比实验,结果表明:所提方法检测帧率和参数量等评价指标均优于对比方法;在Mall数据集上,相较于ConvLSTM人群计数方法,所提方法的平均绝对误差(MAE)、均方误差(MSE)的误差值分别降低了43.75%、72.71%,对不同场景视频人群计数具有更高的准确率和实时性。
-
关键词
人群计数
空间混洗
深度可分离反向残差
多分辨率融合
轻量级网络
-
Keywords
crowd counting
spatial shuffling
deep separable reverse residual
multi-resolution fusion
lightweight network
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-