-
题名引入注意力机制的多分辨率人体姿态估计研究
被引量:4
- 1
-
-
作者
张越
黄友锐
刘鹏坤
-
机构
安徽理工大学电气与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第8期126-132,共7页
-
基金
国家自然科学基金(61772033)。
-
文摘
针对人体姿态估计任务中多分辨率特征表征直接融合时存在无法有效利用特征图空间特征信息的问题,基于High-Resolution Net(HRNet)进行结构设计,构建出结合了通道域注意力和空间域注意力机制的多分辨率人体姿态估计网络GCT-Nonlocal Net(GNNet),提出了一种基于注意力机制的多分辨率表征融合方法,在不同分辨率表征融合前由空间注意力提取出各分辨率表征更有用的空间特征信息来改进融合单元,使得各分辨率表征间的信息融合效果更佳,最终输出的高分辨率表征含有更丰富的特征信息,同时构造了Gateneck模块和Gateblock模块,其通过引入通道注意力更明确地对通道关系建模从而高效地提取通道信息。在MS COCOVAL 2017进行验证,结果显示提出的GNNet相较于SOTA级表现的HRNet在相当参数量与运算量的情况下获得了更高的准确度,mAP提高了1.4个百分点。实验结果表明,所提方法有效地提高了多分辨率特征表征融合效果。
-
关键词
卷积神经网络
人体姿态估计
多分辨率特征表征融合
空间域注意力机制
通道域注意力机制
-
Keywords
convolutional neural network
human pose estimation
multi-resolution feature representation fusion
spatial attention mechanism
channel attention mechanism
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-