期刊文献+
共找到176篇文章
< 1 2 9 >
每页显示 20 50 100
多尺度和多层级特征融合的人体姿态估计 被引量:2
1
作者 王燕妮 胡敏 +2 位作者 韩世鹏 陈艺瑄 吕昊 《计算机工程与应用》 北大核心 2025年第6期199-209,共11页
人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(m... 人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(multi-scale and multi-level network,MSLNet)。采用高分辨率网络(high-resolution network,HRNet)作为主干,通过跨尺度信息交互,实现不同分辨率特征图之间的信息交换,获取同时包含细粒度和粗粒度的姿态特征;引入期望最大化注意力-加权双向特征金字塔网络(expectation maximization attention-bidirectional feature pyramid network,EMA-BiFPN),实现多尺度特征融合后的多层级特征聚合,从局部到全局捕捉人体姿态的细节和关联信息;设计由残差结构组成的关键点检测头,完成输出特征的最终融合并提升人体关键点检测准确率。实验结果表明,MSLNet在COCO和MPII数据集上分别取得了75.8%和91.1%的准确率,实现了最优精度,充分验证了MSLNet能够融合尺度和层级之间的互补特征,进而提升人体姿态估计精度。 展开更多
关键词 高分辨率网络(HRNet) 人体姿态估计 期望最大化注意力 双向特征金字塔网络 特征融合
在线阅读 下载PDF
三维人体姿态估计中的多尺度时空特征融合
2
作者 张宇 刘骊 +2 位作者 付晓东 刘利军 彭玮 《计算机辅助设计与图形学学报》 北大核心 2025年第1期75-88,共14页
针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注... 针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注意力机制和多层感知机构建空间多尺度特征融合模块,融合关节点、肢体和上/下身三个空间多尺度特征,得到初步姿态特征序列;最后建立时序多尺度编码进行时序特征融合获得最终姿态特征序列,并通过时序解码,优化生成细化的三维人体姿态.在Human3.6M数据集上的实验结果表明,所提方法的平均每关节位置P-MPJPE和速度误差MPJVE分别为33.6和2.4,较对比方法降低了2.3%和4.0%,能够降低计算复杂度,提高三维人体姿态估计精度,生成准确、平滑的三维人体姿态估计结果.此外,在HumanEva-I数据集的测试结果表明,所提方法也具有一定的泛化性. 展开更多
关键词 三维人体姿态估计 多尺度特征 自注意力机制 时空特征融合 时序编码
在线阅读 下载PDF
复杂场景下的多人人体姿态估计算法
3
作者 石磊 王天宝 +3 位作者 孟彩霞 王清贤 高宇飞 卫琳 《郑州大学学报(理学版)》 北大核心 2025年第4期1-7,共7页
复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,... 复杂场景下人员的交叉遮挡,导致现有的人体姿态估计算法存在准确度不高和人体骨架错连的问题。为此,提出一种复杂场景下的多人人体姿态估计优化算法。首先,使用分组分块级联卷积替换普通卷积,结合特征融合促进特征通道之间的信息交互,在不引入额外计算成本的前提下提高算法精度;其次,引入空间注意力机制挖掘与人体姿态估计任务相关的空间语义特征,将网络结构并行化处理以提高算法性能;最后,对大卷积核和空间注意力机制的嵌入位置进行轻量化处理,减少时间开销。与现有的自底向上的姿态估计算法OpenPifPaf++相比,所提算法在COCO 2017数据集上平均准确率提高0.8个百分点;在CrowdPose数据集上平均准确率比OpenPifPaf算法提高1.2个百分点,复杂场景下对应的准确率提高1.5个百分点。 展开更多
关键词 复杂场景 多人人体姿态估计 分组卷积 空间注意力机制 轻量化
在线阅读 下载PDF
基于轻量化网络的特定目标人体姿态估计算法
4
作者 张宝峰 贾炜昂 +4 位作者 刘娜 陆浩宇 杨雷 王莉 刘斌 《计算机应用与软件》 北大核心 2025年第9期196-202,219,共8页
针对多人场景下对单一目标姿态估计的需求,将YOLOv5系列网络与提出的目标选择环节、轻量化light-duc模型进行融合,用于特定目标人体姿态估计。该文利用YOLOv5网络进行人体框检测;将DeepSORT多目标跟踪与条件筛选进行融合,构成目标选择... 针对多人场景下对单一目标姿态估计的需求,将YOLOv5系列网络与提出的目标选择环节、轻量化light-duc模型进行融合,用于特定目标人体姿态估计。该文利用YOLOv5网络进行人体框检测;将DeepSORT多目标跟踪与条件筛选进行融合,构成目标选择环节用于选出指定目标,设计light-duc轻量化模型,完成指定目标人体姿态估计。实验结果表明,所提light-duc网络与原网络相比,速度提升了157%,YOLOv5s模型与light-duc模型结合对单人视频的检测速度提升了319%。 展开更多
关键词 人体姿态估计 多目标跟踪 轻量化 目标选择
在线阅读 下载PDF
基于时空注意力的3D人体姿态估计网络设计
5
作者 易见兵 张裕贤 +3 位作者 曹锋 李俊 彭鑫 陈鑫 《广西师范大学学报(自然科学版)》 北大核心 2025年第5期130-144,共15页
在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出... 在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出一种移动视觉Transformer时间注意力模块,该模块通过引入SiLU激活函数,以获取更多姿态特征细节;最后,提出一种通道注意力模块,该模块通过引入并行分支处理架构及增加归一化层,以调整输出通道的特征权重,达到算法对人体姿态特征的关注和弱化其背景特征的目的。在Human3.6M数据集上进行实验,相较于基准模型Strided Transformer,将级联金字塔网络提取的2D关节点作为输入时,每关节位置误差的平均值和进行普罗克鲁斯对齐后的每关节位置误差的平均值分别下降2.5%和2.3%;将Human3.6M数据集标注的2D关节点作为输入时,每关节位置误差的平均值下降6.7%。实验结果表明,本文提出的算法准确性较高。 展开更多
关键词 3D人体姿态估计 遮挡 时空注意力 通道注意力 TRANSFORMER
在线阅读 下载PDF
基于无线信号的人体姿态估计综述
6
作者 陈彦 张锐 +6 位作者 李亚东 宋瑞源 耿瑞旭 龚汉钦 汪斌全 张东恒 胡洋 《雷达学报(中英文)》 北大核心 2025年第1期229-247,共19页
人体姿态估计在人机交互、动作捕捉和虚拟现实等领域具有广泛的应用前景,一直是人体感知研究的重要方向。然而,基于光学图像的姿态估计方法往往受限于光照条件和隐私问题。因此,利用可在各种光照遮挡下工作,且具有隐私保护性的无线信号... 人体姿态估计在人机交互、动作捕捉和虚拟现实等领域具有广泛的应用前景,一直是人体感知研究的重要方向。然而,基于光学图像的姿态估计方法往往受限于光照条件和隐私问题。因此,利用可在各种光照遮挡下工作,且具有隐私保护性的无线信号进行人体姿态估计获得了更多关注。根据无线信号的工作频率,现有技术可分为高频方法和低频方法,且不同的信号频率对应硬件系统、信号特性、噪声处理和深度学习算法设计等方面均有所不同。该文将以毫米波雷达、穿墙雷达和WiFi信号为代表,回顾其在人体姿态重建研究中的进展和代表性工作,分析各类信号模式的优势与局限,并对潜在研究难点以及未来发展趋势进行了展望。 展开更多
关键词 人体姿态估计 无线感知 深度学习 毫米波雷达 穿墙雷达 WIFI
在线阅读 下载PDF
基于增强特征融合的轻量级人体姿态估计网络
7
作者 施昕昕 张昊亮 《电子测量技术》 北大核心 2025年第2期189-198,共10页
为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征... 为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征图的信息提取和归纳总结能力;接着设计了结合特征融合模块设计了特征融合分支,以达到保留模型不同阶段的信息不会随长期卷积运算而丢失的效果;最后对模型输出的关键点分类图进行后处理操作,对分类部分使用分类损失增强模块进行进一步增强,使其能够更好地专注于关键点分类任务,以提高模型输出的准确性。在CrowdPose数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为50.7%和48.4%;在S结构下,AP值分别为59.1%和58.3%。在MS COCO val2017数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为41.9%和40.6%;在S结构下,AP值分别为57.0%和56.8%。实验结果表明,本文算法提出的多层级特征融合模块和高分辨率融合分支以及后处理操作对人体姿态估计网络检测性能提升具有正向作用。 展开更多
关键词 人体姿态估计 轻量级网络 多尺度特征融合 深度可分离卷积
在线阅读 下载PDF
基于时空图卷积网络与多层次特征融合的快递员3D人体姿态估计
8
作者 丁德波 史耀群 《传感技术学报》 北大核心 2025年第8期1457-1462,共6页
将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,... 将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,有效提取关节间的空间关系及时序依赖性。接着,通过引入多层次特征融合模块,融合来自不同网络层的特征信息,包括低层次的细节特征和高层次的抽象特征,从而更全面地捕捉快递员的人体关节动态变化和运动模式。为了验证所提方法的性能,在公开数据集Human3.6M上进行了实验。该数据集由视觉传感器采集得到,包含了丰富的人体姿态信息。仿真实验结果表明,所提出的方法能够显著提高三维姿态估计的精度。 展开更多
关键词 三维人体姿态估计 时空图卷积网络 多层次特征融合
在线阅读 下载PDF
基于注意力细化的实时人体姿态估计网络 被引量:1
9
作者 叶永芳 石守东 +2 位作者 蓝艇 邱科迪 赵天翔 《传感器与微系统》 北大核心 2025年第2期104-107,共4页
由于人体姿态的复杂性和多样性,取得高准确度的网络模型往往具有大量的参数和复杂的结构,给部署和应用带来一定困难。本文提出一种基于注意力细化的实时人体姿态估计网络,使用多分辨率图像金字塔嵌入模块融合图片中多分辨率的空间特征,... 由于人体姿态的复杂性和多样性,取得高准确度的网络模型往往具有大量的参数和复杂的结构,给部署和应用带来一定困难。本文提出一种基于注意力细化的实时人体姿态估计网络,使用多分辨率图像金字塔嵌入模块融合图片中多分辨率的空间特征,减少单分辨率下空间特征损失;使用注意力细化网络进行人体姿态估计,对全局注意力特征进行局部细化,降低参数量与计算量,实现实时的人体姿态估计。本文方法达到701 fps的推理速度,与推理速度为174 fps的HRFormer-small相比,提升4倍,但在精度上略低0.34%。 展开更多
关键词 人体姿态估计 TRANSFORMER 注意力细化
在线阅读 下载PDF
基于大模型的钻井现场人体姿态估计方法研究 被引量:1
10
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
基于深度学习的二维人体姿态估计研究进展 被引量:5
11
作者 卢官明 卢峻禾 陈晨 《南京邮电大学学报(自然科学版)》 北大核心 2024年第1期44-55,共12页
人体姿态估计在人体行为识别、人机交互、体育运动分析等方面有着广泛的应用前景,是计算机视觉领域的一个研究热点。在最近的十年中,得益于深度学习技术,大量的研究工作极大地推动了人体姿态估计技术的发展,但由于受训练样本不足、人体... 人体姿态估计在人体行为识别、人机交互、体育运动分析等方面有着广泛的应用前景,是计算机视觉领域的一个研究热点。在最近的十年中,得益于深度学习技术,大量的研究工作极大地推动了人体姿态估计技术的发展,但由于受训练样本不足、人体姿态的多变性、遮挡、环境的复杂性等因素影响,人体姿态估计仍然面临着诸多的挑战。文中对近年来基于深度学习的2D人体姿态估计方法进行归纳和总结,着重分析一些有代表性的人体姿态估计方法的思路及工作原理,以便研究人员了解当前的研究现状、面临的挑战以及今后的研究方向,拓展研究思路。 展开更多
关键词 人体姿态估计 人体姿态估计 人体姿态估计 深度学习 关键点检测
在线阅读 下载PDF
教学场景下基于几何关系感知的人体姿态估计表示学习模型
12
作者 刘海 朱俊艳 +2 位作者 张昭理 周启云 宋云霄 《计算机工程》 北大核心 2025年第10期97-110,共14页
人体姿态估计(HPE)任务是计算机视觉领域中的一项重要研究工作,它在教学场景下有着广泛应用。当前该任务仍然面临着许多挑战,例如在背景杂乱、人体图像尺度小、人体被遮挡等复杂场景下出现准确率下降的问题,与此同时,人体姿态的灵活多... 人体姿态估计(HPE)任务是计算机视觉领域中的一项重要研究工作,它在教学场景下有着广泛应用。当前该任务仍然面临着许多挑战,例如在背景杂乱、人体图像尺度小、人体被遮挡等复杂场景下出现准确率下降的问题,与此同时,人体姿态的灵活多变性则要求模型具有良好的推理预测能力。针对上述问题,提出一种几何关系感知的人体姿态表示学习模型,通过人体的结构化信息来帮助模型更好地理解不同姿态之间的关系,从而提高对复杂姿势预测的准确性和鲁棒性,实现其在课堂场景下的有效应用。该模型主要包括通道重加权、多token信息交互、肢体方向构建和自适应损失传播4个模块。肢体方向构建模块实现了对人体关节之间几何结构的建模,这一输入线索有利于模型捕捉到身体部位之间的相对位置和方向关系;通道重加权模块能够自动选择和强调对姿态估计任务最有帮助的特征信息,提升输入图像的视觉特征的表达能力;基于Transformer编码器的多token信息交互模块实现了图像特征线索、关节坐标线索和肢体方向线索之间的有效交互;最后,在自适应损失传播模块对传统的损失函数进行优化,进一步提高了模型的训练效果和性能。模型在2个主流数据集COCO和MPII上分别达到了76.1%、90.3%的准确率,超过了现有的一些SOTA(State of the Art)模型,在复杂场景下实现了更加准确合理的预测结果。 展开更多
关键词 人体姿态估计 几何结构线索 肢体方向 TRANSFORMER 图像理解
在线阅读 下载PDF
基于融合特征状态空间模型的轻量化人体姿态估计
13
作者 李卓然 李华 +1 位作者 王桐 蒋朝哲 《计算机应用》 北大核心 2025年第10期3179-3186,共8页
在人体姿态估计(HPE)领域中,基于热图的方法存在量化误差大、计算复杂度高和需要对热图进行后处理等问题。针对上述问题,以坐标回归的SimCC方法为基线,提出一种基于融合特征的状态空间模型(MSSM)的轻量化HPE方法Lite-SimCC。首先,采用Sh... 在人体姿态估计(HPE)领域中,基于热图的方法存在量化误差大、计算复杂度高和需要对热图进行后处理等问题。针对上述问题,以坐标回归的SimCC方法为基线,提出一种基于融合特征的状态空间模型(MSSM)的轻量化HPE方法Lite-SimCC。首先,采用ShuffleNet V2作为骨干网络,替代原有的HRNet(High-Resolution Net),简化为单分支形式结构,并实现模型的轻量化;其次,为了降低精确率的损失,引入大核卷积提取全局特征信息;然后,设计MSSM,用于处理局部和全局长序列特征,增强关键点的表征能力;最后,提出一种基于软标签的损失函数,替代传统的one-hot损失计算方式。实验结果表明,与基线方法SimCC相比,Lite-SimCC的参数量少了87.1%,在COCO2017测试集上的平均精确率(AP)提升了1.4%,在MPII数据集上验证了Lite-SimCC在保证检测精确率的基础上有效降低了模型的参数量。 展开更多
关键词 人体姿态估计 坐标回归 状态空间模型 轻量化 软标签
在线阅读 下载PDF
融合注意力机制的双路人体姿态估计网络
14
作者 赵一鸣 孙士保 +2 位作者 石念峰 王国强 王喜龙 《计算机工程与设计》 北大核心 2025年第8期2297-2304,共8页
针对基于Transformer的人体姿态估计算法局部特征提取能力不足,且在热图转换过程中产生量化误差导致关键点预测精度低的问题,提出一种融合注意力机制的双路人体姿态估计方法。设计了双路CNN-Transformer模块(CT模块),同时捕获人体姿态... 针对基于Transformer的人体姿态估计算法局部特征提取能力不足,且在热图转换过程中产生量化误差导致关键点预测精度低的问题,提出一种融合注意力机制的双路人体姿态估计方法。设计了双路CNN-Transformer模块(CT模块),同时捕获人体姿态的局部特征和全局表征,提高模型的特征表达能力;构建多谱特征多样性模块,通过学习不同频率的分量增强卷积,提取有效的人体姿态局部特征信息;采用无偏数据处理消除人体关键点在热图编码过程中产生的量化误差。实验结果表明,与SimpleBaseline相比,所提方法在降低模型复杂度和计算量的同时,在COCO和MPII数据集上将平均精度分别提升了2.7和0.7个百分点。 展开更多
关键词 人体姿态估计 卷积神经网络 TRANSFORMER 多谱注意力 局部特征 全局依赖性 热图编码
在线阅读 下载PDF
联合跨阶段信息的轻量化人体姿态估计
15
作者 陈相龙 李松洋 +2 位作者 陈恩庆 郭新 汪松 《计算机工程与应用》 北大核心 2025年第16期160-170,共11页
人体姿态估计任务在实际应用中往往要求网络模型既有较高的估计精度又能快速高效地实现,因此在模型设计时需要兼顾准确率和实时性,并使模型能在资源有限的边缘设备上部署运行。然而目前轻量化人体姿态估计模型存在随着计算复杂度的降低... 人体姿态估计任务在实际应用中往往要求网络模型既有较高的估计精度又能快速高效地实现,因此在模型设计时需要兼顾准确率和实时性,并使模型能在资源有限的边缘设备上部署运行。然而目前轻量化人体姿态估计模型存在随着计算复杂度的降低而精度显著下降的问题,无法兼顾准确率和速度,因而在边缘设备中难以部署。为解决这一问题,采用轻量级主干网络EMO(efficient model),设计一种跨阶段注意力机制,通过借鉴跨阶段特征分布信息引导不同尺度特征对齐,并根据不同阶段特征的权重设计简单有效的多层特征融合方法。引入特征融合监督损失函数,直接优化多尺度特征融合过程,并对特征解码器进行轻量化改进,使模型在速度与精度上达到平衡。在COCO与MPII数据集上的测试结果表明,与基准模型相比,模型在降低复杂度的情况下达到了更优的准确率,并且优于主流轻量化模型。 展开更多
关键词 人体姿态估计 多尺度特征融合 轻量化网络 特征融合监督
在线阅读 下载PDF
基于平行多尺度时空图卷积网络的三维人体姿态估计算法
16
作者 杨红红 刘泓希 +1 位作者 张玉梅 吴晓军 《软件学报》 北大核心 2025年第5期2151-2166,共16页
针对基于图卷积神经网络(GCN)的人体姿态估计方法不能充分聚合关节点时空特征、限制判别性特征提取的问题,构造基于平行多尺度时空图卷积的网络模型(PMST-GNet),提高三维人体姿态估计的性能.该模型首先设计对角占优的时空注意力图卷积(D... 针对基于图卷积神经网络(GCN)的人体姿态估计方法不能充分聚合关节点时空特征、限制判别性特征提取的问题,构造基于平行多尺度时空图卷积的网络模型(PMST-GNet),提高三维人体姿态估计的性能.该模型首先设计对角占优的时空注意力图卷积(DDA-STGConv),构建跨域时空邻接矩阵,对骨架关节点信息进行基于自约束和注意力机制约束的建模,增强节点间的信息交互;然后,通过设计图拓扑聚合函数构造不同的图拓扑结构,以DDA-STGConv为基本单元构建平行多尺度子网络模块(PM-SubGNet);最后,为了更好地提取骨架关节的上下文信息,设计多尺度特征交叉融合模块(MFEB),实现平行子图网络之间多尺度信息的交互,提高GCN的特征表示能力.在主流3D姿态估计数据集Human3.6M和MPI-INF-3DHP数据集上的对比实验结果表明,所提PMST-GNet模型在三维人体姿态估计中具有较好的效果,优于Sem-GCN、GraphSH、UGCN等当前基于GCN网络的主流算法. 展开更多
关键词 三维人体姿态估计 对角占优的时空注意力图卷积 平行多尺度子网络 多尺度特征交叉融合
在线阅读 下载PDF
基于Transformer和PointNet++的毫米波雷达人体姿态估计 被引量:2
17
作者 李阳 刘毅 +3 位作者 李浩 张刚 徐明枫 郝崇清 《计算机科学》 北大核心 2025年第S1期433-441,共9页
人体姿态估计作为动作识别领域中的研究热题被广泛地应用在医疗、安防和监控等方面,对推动相关行业的智能化发展具有重要意义。但目前基于图像的人体姿态估计对环境要求较高且隐私性差。基于此,提出了一种基于毫米波雷达点云的人体姿态... 人体姿态估计作为动作识别领域中的研究热题被广泛地应用在医疗、安防和监控等方面,对推动相关行业的智能化发展具有重要意义。但目前基于图像的人体姿态估计对环境要求较高且隐私性差。基于此,提出了一种基于毫米波雷达点云的人体姿态估计方法,该方法使用PointNet++对毫米波雷达点云进行特征提取,与基于CNN的姿态估计方法相比,其在各关节点的MSE,MAE,RMSE值更低。此外,为了解决毫米波雷达点云稀疏的问题,使用了一种多帧点云拼接策略,以增加点云的数量,其中以拼接三帧点云为输入的模型相比于原始模型的MSE和MAE值分别降低了0.22 cm和0.72 cm,有效地缓解了点云过于稀疏的问题。最后,为了充分利用不同点云之间的时序特征,将Transformer与PointNet++相结合,并通过消融实验证明了多帧点云拼接策略和加入Transformer结构这两种方法的有效性,其MSE和MAE两个指标值分别达到了0.59 cm和5.41 cm,为实现性能更优的射频人体姿态估计提供了一种新思路。 展开更多
关键词 人体姿态估计 毫米波雷达 PointNet++ 点云数据 TRANSFORMER
在线阅读 下载PDF
基于解耦注意力与幻影卷积的轻量级人体姿态估计 被引量:2
18
作者 陈俊颖 郭士杰 陈玲玲 《计算机应用》 北大核心 2025年第1期223-233,共11页
随着轻量级网络的发展,人体姿态估计任务得以在计算资源有限的设备上执行,然而,提升精度变得更具有挑战性。这些挑战主要源于网络复杂度与计算资源的矛盾,导致模型在简化时牺牲了表示能力。针对上述问题,提出一种基于解耦注意力和幻影... 随着轻量级网络的发展,人体姿态估计任务得以在计算资源有限的设备上执行,然而,提升精度变得更具有挑战性。这些挑战主要源于网络复杂度与计算资源的矛盾,导致模型在简化时牺牲了表示能力。针对上述问题,提出一种基于解耦注意力和幻影卷积的轻量级人体姿态估计网络(DGLNet)。具体来说,DGLNet以小型高分辨率网络(Small HRNet)模型为基础架构,通过引入解耦注意力机制构建DFDbottleneck模块;采用shuffleblock的结构对基础模块进行重新设计,即用轻量级幻影卷积替代计算量大的点卷积,并利用解耦注意力机制增强模块性能,从而构建DGBblock模块;此外,用幻影卷积和解耦注意力重新构建的深度可分离卷积模块来替代原过渡层模块,从而构建GSCtransition模块,进一步减少计算量并增强特征交互性和提高性能。在COCO验证集上的实验结果显示,DGLNet优于轻量级高分辨率网络(Lite-HRNet),在计算量和参数量不增加的情况下,最高精度达到了71.9%;与常见的轻量级姿态估计网络MobileNetV2和ShuffleNetV2相比,DGLNet在仅使用21.2%和25.0%的计算量情况下分别实现了4.6和8.3个百分点的精度提升;在AP^(50)的评价标准上,DGLNet超过了大型高分辨率网络(HRNet)的同时计算量和参数量远小于HRNet。 展开更多
关键词 人体姿态估计 轻量级网络 注意力机制 幻影卷积 深度可分离卷积模块
在线阅读 下载PDF
基于Transformer与图卷积网络的三维人体姿态估计
19
作者 王宇晶 包明明 刘星 《传感技术学报》 北大核心 2025年第9期1624-1630,共7页
提出了一种Transformer与图网络相结合的网络模型,用于对视觉传感器采集到的视频图像进行三维人体姿态估计。Transformer能够有效地从二维关键关节点中提取时空维度高相关性特征,而图网络则能够感知细节相关性特征,通过融合这两种网络结... 提出了一种Transformer与图网络相结合的网络模型,用于对视觉传感器采集到的视频图像进行三维人体姿态估计。Transformer能够有效地从二维关键关节点中提取时空维度高相关性特征,而图网络则能够感知细节相关性特征,通过融合这两种网络结构,提高了三维姿态估计的精度。在公开数据集Human3.6M上进行了仿真实验,验证了Transformer与图卷积融合算法的性能。实验结果显示,最终估计得到的三维人体关节点的平均关节点位置偏差(Mean Per Joint Position Error,MPJPE)为38.4 mm,相较于现有方法有一定提升,表明该方法具有较强的应用价值,可应用于许多下游相关工作中。 展开更多
关键词 三维人体姿态估计 TRANSFORMER 图卷积 时空相关性
在线阅读 下载PDF
面向复杂工业场景的人体姿态估计性能增强方法
20
作者 李帆雅 张泽辉 +2 位作者 陈博洋 徐晓滨 管聪 《仪器仪表学报》 北大核心 2025年第8期255-265,共11页
人体姿态估计是工业制造5.0的重要支撑技术之一,已经在行为识别、人机交互、数字孪生等多种场景展开了应用。然而,在复杂工业场景下,告示牌、管线、立柱等物品极易对作业人员形成局部或全局遮挡,导致人体姿态估计模型在关键点定位时出... 人体姿态估计是工业制造5.0的重要支撑技术之一,已经在行为识别、人机交互、数字孪生等多种场景展开了应用。然而,在复杂工业场景下,告示牌、管线、立柱等物品极易对作业人员形成局部或全局遮挡,导致人体姿态估计模型在关键点定位时出现偏差,造成模型对姿态估计的准确率降低。针对该问题,提出了一种面向复杂工业场景的人体姿态估计性能增强方法,该方法首先基于量子化自编码器对人体关键点进行结构化建模,将关节点特征映射到量子化隐空间,以提升人体部分遮挡时姿态估计的准确率。然后,针对工人遮挡数据集构建困难的问题,创新地提出了一种面向人体姿态遮挡的动态数据增强训练方法,在模型训练过程中,通过评估人体姿态估计模型在数据集上对各关键点的估计结果,使用工业场景真实遮挡物动态生成符合工业场景特征的工人遮挡图片用于下一次模型训练,进一步提升模型在人体姿态估计任务中的鲁棒性。实验结果证明,所提的方法在自建数据集上相比先进方法PCT平均准确率AP和平均召回率AR分别提升了3.8%和2.7%,其能够有效地应对复杂工业场景中的作业人员人体遮挡问题。 展开更多
关键词 人体姿态估计 工业遮挡 数据增强 计算机视觉
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部