-
题名多分支骨架特征输入下的歧义行为识别
- 1
-
-
作者
王超亚
韩华
王春媛
田瑾
-
机构
上海工程技术大学电子电气工程学院
-
出处
《计算机应用研究》
北大核心
2025年第11期3497-3505,共9页
-
基金
国家自然科学基金项目(62103257)
上海市自然科学基金项目(22ZR1426200)。
-
文摘
基于骨架的人体动作识别是计算机视觉中的一个重要研究课题,其核心在于提取和学习具有区分度的骨架特征,以实现高精度的动作分类。但是由于歧义行为的存在,严重影响了分类识别的准确性,为此,围绕数据优化与计算复杂度降低,以及时空特征精细化建模两个核心方向提出两项关键创新。首先在数据输入的初期阶段,采用多分支输入结构,实现早期特征融合,使模型能够更高效地学习不同模态间的互补信息,从而提升计算效率并增强模型的泛化能力;其次,提出模糊特征细化模型,该模型有助于提取独特的时空特征,增强了对动作细节的敏感性以帮助区分高相似度行为,从而实现更精细的时空特征建模。将所提多分支骨架特征输入下的歧义行为识别(GCN+)模型在D60和D120两个大规模公共数据集上进行实验证。实验范围涵盖四种单一模态及其融合模态。在单一模态下相较于基线模型,GCN+在D120的X-Sub下提升了2.6个百分点,表明其在复杂环境下对不同主体的识别能力更强;在融合模态下,GCN+在D120数据集的X-Sub评估下提升了3.2个百分点,在X-Set评估下提升了3.0个百分点。进一步验证了该模型在大规模数据场景下的适用性,和在跨主体和跨视角识别任务方面展现的卓越性能。
-
关键词
骨架识别
图卷积神经网络
多分支输入
歧义行为
模糊特征细化
-
Keywords
skeleton recognition
graph convolution network
multiple-input-branches
ambiguous action
ambiguous feature refinement
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-