-
题名融合注意力机制的双路人体姿态估计网络
- 1
-
-
作者
赵一鸣
孙士保
石念峰
王国强
王喜龙
-
机构
河南科技大学信息工程学院
洛阳理工学院计算机与信息工程学院
洛阳理工学院河南省绿色建筑材料制造与智能装备重点实验室
上海电力大学电子与信息工程学院
-
出处
《计算机工程与设计》
北大核心
2025年第8期2297-2304,共8页
-
基金
河南自然科学基金项目(232300420157)
龙门实验室前沿探索课题基金项目(LMQYTSKT034)
河南省科技攻关计划基金项目(242102321138)。
-
文摘
针对基于Transformer的人体姿态估计算法局部特征提取能力不足,且在热图转换过程中产生量化误差导致关键点预测精度低的问题,提出一种融合注意力机制的双路人体姿态估计方法。设计了双路CNN-Transformer模块(CT模块),同时捕获人体姿态的局部特征和全局表征,提高模型的特征表达能力;构建多谱特征多样性模块,通过学习不同频率的分量增强卷积,提取有效的人体姿态局部特征信息;采用无偏数据处理消除人体关键点在热图编码过程中产生的量化误差。实验结果表明,与SimpleBaseline相比,所提方法在降低模型复杂度和计算量的同时,在COCO和MPII数据集上将平均精度分别提升了2.7和0.7个百分点。
-
关键词
人体姿态估计
卷积神经网络
TRANSFORMER
多谱注意力
局部特征
全局依赖性
热图编码
-
Keywords
human pose estimation
convolutional neural network
Transformer
multi-spectral attention
local features
global dependency
heatmap encoding
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-