期刊文献+
共找到199篇文章
< 1 2 10 >
每页显示 20 50 100
基于改进YOLOv8-pose的分心驾驶检测与识别 被引量:4
1
作者 朱周华 侯智杰 +1 位作者 田成源 周怡纳 《电子测量技术》 北大核心 2024年第15期135-143,共9页
针对现有的分心驾驶检测算法存在检测率低、检测速率慢等问题,本文构建了一种基于改进YOLOv8-pose的分心驾驶检测识别模型YOLOv8-EFM。首先,通过使用EfficientViT更换YOLOv8-pose的主干网络,结合CNN和VIT之间的互补性,提升了检测的准确... 针对现有的分心驾驶检测算法存在检测率低、检测速率慢等问题,本文构建了一种基于改进YOLOv8-pose的分心驾驶检测识别模型YOLOv8-EFM。首先,通过使用EfficientViT更换YOLOv8-pose的主干网络,结合CNN和VIT之间的互补性,提升了检测的准确率;其次,使用FasterBlock模块替换C2f中的Bottleneck模块,增加了检测速率并减小模型参数;最后在SPPF后加入了轻量级的MLCA注意力模块,在模型大小和准确性之间取得了良好的平衡。实验结果表明,本文所构建的YOLOv8-EFM模型,mAP50可以达到98.9%,模型大小只有9.7 M,该方法不仅可以识别出具体分心行为,还可以检测上半身的人体骨架,可以有效应用在驾驶员分心驾驶的检测场景中。 展开更多
关键词 分心检测 人体姿态估计 YOLOv8-pose EfficientViT FasterNet MLCA
在线阅读 下载PDF
基于Yolov7_Pose的轻量化人体姿态估计网络 被引量:1
2
作者 黄健 胡翻 展越 《现代电子技术》 北大核心 2024年第23期98-104,共7页
人体姿态估计在计算机视觉、人机交互与运动分析等领域广泛应用。当前人体姿态估计算法往往通过构建复杂的网络来提高精度,但这带来了模型体量和计算量增大,以及检测速度变慢等问题。因此,文中提出一种基于Yolov7_Pose的轻量化人体姿态... 人体姿态估计在计算机视觉、人机交互与运动分析等领域广泛应用。当前人体姿态估计算法往往通过构建复杂的网络来提高精度,但这带来了模型体量和计算量增大,以及检测速度变慢等问题。因此,文中提出一种基于Yolov7_Pose的轻量化人体姿态估计网络。首先,采用轻量化CARAFE模块替换原网络中的上采样模块,完成上采样工作;接着,在特征融合部分引入轻量化Slim-neck模块,以降低模型的计算量和复杂度;最后,提出了RFB-NAM模块,将其添加到主干网络中,用以获取多个不同尺度的特征信息,扩大感受野,提高特征提取能力。实验结果表明,改进后网络模型的GFLOPs和模型大小分别降低了约18.1%、22%,检测速度提升37.93%,并在低光环境、小目标、密集人群和俯视角度下表现出了较好的性能。 展开更多
关键词 人体姿态估计 Yolov7_pose 轻量化 上采样 CARAFE Slim-neck
在线阅读 下载PDF
基于OpenPose改进的轻量化人体动作识别模型 被引量:24
3
作者 李一凡 袁龙健 王瑞 《电子测量技术》 北大核心 2022年第1期89-95,共7页
本文聚焦于自下而上的人体姿态估计网络OpenPose模型参数量大的缺点,对OpenPose模型的特征提取网络和预测网络分别进行改进,实现轻量化模型的目标。使用参数量更少、准确度更高的ResNet18网络替代了原模型中的VGG19网络,并且在不损失过... 本文聚焦于自下而上的人体姿态估计网络OpenPose模型参数量大的缺点,对OpenPose模型的特征提取网络和预测网络分别进行改进,实现轻量化模型的目标。使用参数量更少、准确度更高的ResNet18网络替代了原模型中的VGG19网络,并且在不损失过多识别精度的前提下,以深度可分离卷积替代了预测网络中的部分卷积核,以此来降低网络结构的参数量。接着通过人工神经网络对人体动作进行分类,在传统的非线性网络中加入了线性模块提高了网络的记忆能力和泛化能力。结果表明,轻量化OpenPose模型的运行帧数比原先提高了9%~16%,动作识别网络经过3000次迭代训练后,站立、坐着、走、坐下和起立的识别精度达到了0.877、0.835、0.793、0.815和0.808。最后,将整体识别网络应用于真实场景下,根据结果表明,该方法可以在嵌入式设备中正常运行,且识别效果较好。 展开更多
关键词 人体姿态估计 Openpose 轻量化模型 深度可分离卷积 人工神经网络
在线阅读 下载PDF
融合注意力机制的OpenPose人体跌倒检测算法 被引量:1
4
作者 孟彩霞 薛洪秋 +2 位作者 石磊 高宇飞 卫琳 《计算机辅助设计与图形学学报》 CSCD 北大核心 2024年第12期2040-2050,共11页
人员密集场所跌倒事件易引发公共安全问题,对人体跌倒进行实时监测和预警可降低安全风险.针对现有基于姿态估计跌倒检测方法模型规模大、时效性差等问题,提出一种融合注意力机制的OpenPose人体跌倒检测算法DSC-OpenPose.首先借鉴DenseNe... 人员密集场所跌倒事件易引发公共安全问题,对人体跌倒进行实时监测和预警可降低安全风险.针对现有基于姿态估计跌倒检测方法模型规模大、时效性差等问题,提出一种融合注意力机制的OpenPose人体跌倒检测算法DSC-OpenPose.首先借鉴DenseNet稠密连接思想,将每层与之前所有层在通道维度上直接连接,实现特征复用,减小模型参数规模;然后在不同阶段之间添加坐标注意力机制,获取特征图空间方向依赖和精确位置信息,提高姿态估计精度;最后提出一种基于人体外椭圆参数、头部高度、下肢高度共同识别跌倒行为的方法,实现人体目标的跌倒检测.实验结果表明,在COCO数据集上,所提算法在模型规模和精度之间取得了较好的平衡效果;在real fall(RF)数据集上,所提跌倒检测算法的准确率达到98.2%,精度达到96.6%,检测速度达到20.2帧/s,且模型规模较小,满足嵌入式设备实时推理需求. 展开更多
关键词 人体姿态估计 密集连接 注意力机制 跌倒检测
在线阅读 下载PDF
基于E-DCPose的视频人体姿态估计 被引量:6
5
作者 徐博 蒲东兵 +1 位作者 王一可 孙英娟 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第4期53-61,共9页
针对视频人体姿态估计中遮挡、关节运动模糊等问题,提出了基于DCPose的人体姿态估计改进算法E-DCPose.E-DCPose在DCPose基础上引入了姿态语义传播、时序热图对齐方法,利用上下文时序信息缓解人体运动过程中关节遮挡和关节运动模糊导致... 针对视频人体姿态估计中遮挡、关节运动模糊等问题,提出了基于DCPose的人体姿态估计改进算法E-DCPose.E-DCPose在DCPose基础上引入了姿态语义传播、时序热图对齐方法,利用上下文时序信息缓解人体运动过程中关节遮挡和关节运动模糊导致的关节定位不准确问题.同时,通过增加视频帧数为模型提供充分的时序信息,提升人体关键点检测精度.在数据集PoseTrack2017与PoseTrack2018上对E-DCPose各改进模块的有效性进行了消融研究,并与现有模型进行了对比实验分析.实验结果表明,E-DCPose的检测精度优于所有对比模型,并显著优于基线模型DCPose. 展开更多
关键词 人体姿态估计 E-DCpose 姿态语义传播 时序热图对齐
在线阅读 下载PDF
ARGP-Pose:基于关键点间关系分析与分组预测的3D人体姿态估计 被引量:7
6
作者 黄程远 宋晓宁 冯振华 《计算机应用研究》 CSCD 北大核心 2022年第7期2178-2182,2202,共6页
尽管3D人体姿态估计已经相对成功,但现存方法在复杂场景下的性能依然差强人意。为了提高在无约束场景下3D人体姿态估计的准确性以及鲁棒性,提出了ARGP-Pose,一种基于探索关键点间关系的单目视频3D人体姿态估计框架。该框架包含一种关键... 尽管3D人体姿态估计已经相对成功,但现存方法在复杂场景下的性能依然差强人意。为了提高在无约束场景下3D人体姿态估计的准确性以及鲁棒性,提出了ARGP-Pose,一种基于探索关键点间关系的单目视频3D人体姿态估计框架。该框架包含一种关键点信息预处理方式以及3D姿态估计网络结构。关键点预处理能够强化结构特征,抽取出关键点之间联系信息,并作为网络输入。3D姿态估计网络能够融合各个关键点的局部信息以及整体姿态的全局信息。此外,利用自注意力模块来提取有效时序信息,以进一步提高预测准确度。而对于复杂姿态,采用了分组预测的方式将复杂动作的预测分解为各个点的预测,从而使网络对复杂姿态的估计能力有了明显的提高。在Human3.6M和HumanEva-I这两个著名数据集上的实验结果证明了所提出的方法的优越性。 展开更多
关键词 卷积神经网络 分组卷积 三维人体姿态估计 关键点间关系 自注意力
在线阅读 下载PDF
基于AlphaPose模型的远距离行人头部姿态估计算法 被引量:2
7
作者 赵思源 彭春蕾 +2 位作者 张云 刘海涛 胡瑞敏 《陕西科技大学学报》 北大核心 2023年第2期191-198,共8页
在公共场所的监控视频中,远距离的行人目标头部区域占比往往较小并且头部区域分辨率较低,仅靠目标检测算法和头部姿态估计模型检测并分类头部特征来判定头部姿态或注视方向存在较大难度.考虑到目前不同分辨率下的人体骨骼关键点估计算... 在公共场所的监控视频中,远距离的行人目标头部区域占比往往较小并且头部区域分辨率较低,仅靠目标检测算法和头部姿态估计模型检测并分类头部特征来判定头部姿态或注视方向存在较大难度.考虑到目前不同分辨率下的人体骨骼关键点估计算法越来越成熟,本研究提出一种利用骨骼关键点和头部姿态之间的关系来进行远距离行人的头部姿态估计算法.该算法首先利用AlphaPose模型检测出二维人体骨骼关键点的全局坐标值,然后根据部分骨骼关键点的坐标值计算出头部朝向象限角度,最后根据预设角度范围计算并可视化出视线落点.目前,尚没有公开发布的可用于远距离行人头部姿态估计的数据集,因此本文建立了一个远距离行人头部姿态系统,以对现有的数据集进行标注,并利用标注的数据集对提出的方法进行测试.结果表明,本文提出的算法可以较精准地判定到远距离行人的头部姿态和注视方向,准确率达到69.7%. 展开更多
关键词 远距离行人头部姿态估计 注视方向估计 人体骨骼关键点检测
在线阅读 下载PDF
基于4D成像雷达的隔墙人体姿态重建与行为识别研究 被引量:1
8
作者 张锐 龚汉钦 +5 位作者 宋瑞源 李亚东 卢智 张东恒 胡洋 陈彦 《雷达学报(中英文)》 北大核心 2025年第1期44-61,共18页
隔墙人体姿态重建和行为识别在智能安防和虚拟现实等领域具有广泛应用前景。然而,现有隔墙人体感知方法通常忽视了对4D时空特征的建模以及墙体对信号的影响,针对这些问题,该文创新性地提出了一种基于4D成像雷达的隔墙人体感知新架构。首... 隔墙人体姿态重建和行为识别在智能安防和虚拟现实等领域具有广泛应用前景。然而,现有隔墙人体感知方法通常忽视了对4D时空特征的建模以及墙体对信号的影响,针对这些问题,该文创新性地提出了一种基于4D成像雷达的隔墙人体感知新架构。首先,基于时空分离的分步策略,该文设计了ST~2W-AP时空融合网络,解决了由于主流深度学习库缺少4D卷积而无法充分利用多帧3D体素时空域信息的问题,实现了保留3D空域信息的同时利用长序时域信息,大幅提升姿态估计任务和行为识别任务的性能。此外,为抑制墙体对信号的干扰,该文利用深度学习强大的拟合性能和并行输出的特点设计了深度回波域补偿器,降低了传统墙体补偿方法的计算开销。大量的实验结果表明,相比于现有最佳方法,ST~2W-AP将平均关节位置误差降低了33.57%,并且将行为识别的F1分数提高了0.51%。 展开更多
关键词 穿墙 人体姿态估计 行为识别 射频感知 深度学习
在线阅读 下载PDF
多尺度和多层级特征融合的人体姿态估计 被引量:2
9
作者 王燕妮 胡敏 +2 位作者 韩世鹏 陈艺瑄 吕昊 《计算机工程与应用》 北大核心 2025年第6期199-209,共11页
人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(m... 人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(multi-scale and multi-level network,MSLNet)。采用高分辨率网络(high-resolution network,HRNet)作为主干,通过跨尺度信息交互,实现不同分辨率特征图之间的信息交换,获取同时包含细粒度和粗粒度的姿态特征;引入期望最大化注意力-加权双向特征金字塔网络(expectation maximization attention-bidirectional feature pyramid network,EMA-BiFPN),实现多尺度特征融合后的多层级特征聚合,从局部到全局捕捉人体姿态的细节和关联信息;设计由残差结构组成的关键点检测头,完成输出特征的最终融合并提升人体关键点检测准确率。实验结果表明,MSLNet在COCO和MPII数据集上分别取得了75.8%和91.1%的准确率,实现了最优精度,充分验证了MSLNet能够融合尺度和层级之间的互补特征,进而提升人体姿态估计精度。 展开更多
关键词 高分辨率网络(HRNet) 人体姿态估计 期望最大化注意力 双向特征金字塔网络 特征融合
在线阅读 下载PDF
基于轻量化网络的特定目标人体姿态估计算法
10
作者 张宝峰 贾炜昂 +4 位作者 刘娜 陆浩宇 杨雷 王莉 刘斌 《计算机应用与软件》 北大核心 2025年第9期196-202,219,共8页
针对多人场景下对单一目标姿态估计的需求,将YOLOv5系列网络与提出的目标选择环节、轻量化light-duc模型进行融合,用于特定目标人体姿态估计。该文利用YOLOv5网络进行人体框检测;将DeepSORT多目标跟踪与条件筛选进行融合,构成目标选择... 针对多人场景下对单一目标姿态估计的需求,将YOLOv5系列网络与提出的目标选择环节、轻量化light-duc模型进行融合,用于特定目标人体姿态估计。该文利用YOLOv5网络进行人体框检测;将DeepSORT多目标跟踪与条件筛选进行融合,构成目标选择环节用于选出指定目标,设计light-duc轻量化模型,完成指定目标人体姿态估计。实验结果表明,所提light-duc网络与原网络相比,速度提升了157%,YOLOv5s模型与light-duc模型结合对单人视频的检测速度提升了319%。 展开更多
关键词 人体姿态估计 多目标跟踪 轻量化 目标选择
在线阅读 下载PDF
基于时空注意力的3D人体姿态估计网络设计
11
作者 易见兵 张裕贤 +3 位作者 曹锋 李俊 彭鑫 陈鑫 《广西师范大学学报(自然科学版)》 北大核心 2025年第5期130-144,共15页
在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出... 在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出一种移动视觉Transformer时间注意力模块,该模块通过引入SiLU激活函数,以获取更多姿态特征细节;最后,提出一种通道注意力模块,该模块通过引入并行分支处理架构及增加归一化层,以调整输出通道的特征权重,达到算法对人体姿态特征的关注和弱化其背景特征的目的。在Human3.6M数据集上进行实验,相较于基准模型Strided Transformer,将级联金字塔网络提取的2D关节点作为输入时,每关节位置误差的平均值和进行普罗克鲁斯对齐后的每关节位置误差的平均值分别下降2.5%和2.3%;将Human3.6M数据集标注的2D关节点作为输入时,每关节位置误差的平均值下降6.7%。实验结果表明,本文提出的算法准确性较高。 展开更多
关键词 3D人体姿态估计 遮挡 时空注意力 通道注意力 TRANSFORMER
在线阅读 下载PDF
三维人体姿态估计中的多尺度时空特征融合
12
作者 张宇 刘骊 +2 位作者 付晓东 刘利军 彭玮 《计算机辅助设计与图形学学报》 北大核心 2025年第1期75-88,共14页
针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注... 针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注意力机制和多层感知机构建空间多尺度特征融合模块,融合关节点、肢体和上/下身三个空间多尺度特征,得到初步姿态特征序列;最后建立时序多尺度编码进行时序特征融合获得最终姿态特征序列,并通过时序解码,优化生成细化的三维人体姿态.在Human3.6M数据集上的实验结果表明,所提方法的平均每关节位置P-MPJPE和速度误差MPJVE分别为33.6和2.4,较对比方法降低了2.3%和4.0%,能够降低计算复杂度,提高三维人体姿态估计精度,生成准确、平滑的三维人体姿态估计结果.此外,在HumanEva-I数据集的测试结果表明,所提方法也具有一定的泛化性. 展开更多
关键词 三维人体姿态估计 多尺度特征 自注意力机制 时空特征融合 时序编码
在线阅读 下载PDF
基于无线信号的人体姿态估计综述
13
作者 陈彦 张锐 +6 位作者 李亚东 宋瑞源 耿瑞旭 龚汉钦 汪斌全 张东恒 胡洋 《雷达学报(中英文)》 北大核心 2025年第1期229-247,共19页
人体姿态估计在人机交互、动作捕捉和虚拟现实等领域具有广泛的应用前景,一直是人体感知研究的重要方向。然而,基于光学图像的姿态估计方法往往受限于光照条件和隐私问题。因此,利用可在各种光照遮挡下工作,且具有隐私保护性的无线信号... 人体姿态估计在人机交互、动作捕捉和虚拟现实等领域具有广泛的应用前景,一直是人体感知研究的重要方向。然而,基于光学图像的姿态估计方法往往受限于光照条件和隐私问题。因此,利用可在各种光照遮挡下工作,且具有隐私保护性的无线信号进行人体姿态估计获得了更多关注。根据无线信号的工作频率,现有技术可分为高频方法和低频方法,且不同的信号频率对应硬件系统、信号特性、噪声处理和深度学习算法设计等方面均有所不同。该文将以毫米波雷达、穿墙雷达和WiFi信号为代表,回顾其在人体姿态重建研究中的进展和代表性工作,分析各类信号模式的优势与局限,并对潜在研究难点以及未来发展趋势进行了展望。 展开更多
关键词 人体姿态估计 无线感知 深度学习 毫米波雷达 穿墙雷达 WIFI
在线阅读 下载PDF
基于自适应热图的轻量化人体姿态估计算法
14
作者 马莉 杨俊祥 +1 位作者 代新冠 高航标 《计算机工程与设计》 北大核心 2025年第11期3103-3110,共8页
针对轻量化人体姿态估计算法精度低、传统热图方法不适用于多尺度关键点的检测和在嵌入式设备上延时大的问题,在LitePose基础上提出基于自适应热图的轻量化人体姿态估计算法。该算法在解耦全连接注意力模块引入并行分支生成多尺度信息,... 针对轻量化人体姿态估计算法精度低、传统热图方法不适用于多尺度关键点的检测和在嵌入式设备上延时大的问题,在LitePose基础上提出基于自适应热图的轻量化人体姿态估计算法。该算法在解耦全连接注意力模块引入并行分支生成多尺度信息,设计自适应关键点增强模块,用自适应热图自动生成多尺度关键点热图,用匈牙利算法后处理。实验结果表明,与LitePose相比,该算法在两个公开数据集上精度分别提高5.7%和6.9%,在嵌入式设备上能达30 FPS,实现高实时性。 展开更多
关键词 姿态估计 多尺度信息 自适应热图 匈牙利算法 轻量化 注意力机制 嵌入式设备
在线阅读 下载PDF
基于增强特征融合的轻量级人体姿态估计网络
15
作者 施昕昕 张昊亮 《电子测量技术》 北大核心 2025年第2期189-198,共10页
为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征... 为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征图的信息提取和归纳总结能力;接着设计了结合特征融合模块设计了特征融合分支,以达到保留模型不同阶段的信息不会随长期卷积运算而丢失的效果;最后对模型输出的关键点分类图进行后处理操作,对分类部分使用分类损失增强模块进行进一步增强,使其能够更好地专注于关键点分类任务,以提高模型输出的准确性。在CrowdPose数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为50.7%和48.4%;在S结构下,AP值分别为59.1%和58.3%。在MS COCO val2017数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为41.9%和40.6%;在S结构下,AP值分别为57.0%和56.8%。实验结果表明,本文算法提出的多层级特征融合模块和高分辨率融合分支以及后处理操作对人体姿态估计网络检测性能提升具有正向作用。 展开更多
关键词 人体姿态估计 轻量级网络 多尺度特征融合 深度可分离卷积
在线阅读 下载PDF
语义增强和自适应多尺度特征融合的人体姿态估计
16
作者 张家波 何阿娟 唐上松 《计算机工程与应用》 北大核心 2025年第23期212-223,共12页
由于关键点尺度较小且位置敏感,如何有效提取空间和语义信息一直是姿态估计任务的主要挑战。为此,提出了一种语义增强和自适应多尺度特征融合的人体姿态估计模型(SAMFFNet)。SAMFFNet以轻量级的Mobile-NetV2作为骨干网络构建特征金字塔... 由于关键点尺度较小且位置敏感,如何有效提取空间和语义信息一直是姿态估计任务的主要挑战。为此,提出了一种语义增强和自适应多尺度特征融合的人体姿态估计模型(SAMFFNet)。SAMFFNet以轻量级的Mobile-NetV2作为骨干网络构建特征金字塔,利用EfficientViT生成尺度感知的全局语义,在设计的深层语义注入模块中,利用上下文引导的注意力将全局语义与局部特征融合,增强关键点的语义表示。提出了自适应多尺度特征融合模块,该模块通过集成大型选择卷积核模块(LSK)和跨层交互机制,能根据输入特征动态地调节较大的空间感受野,并增强不同尺度特征之间的信息交互。实验结果表明,在COCO验证集上,SAMFFNet与使用的骨干网络相比,精度指标提升了6.1个百分点,达到70.7%,虽然比大模型SimpleBaseline的精度略低,但参数量减少了85.0%,计算量降低了78.3%。同样在MPII数据集上,与骨干网络相比也实现了2.3个百分点的精度提升。综合COCO与MPII数据集上的表现,充分证实了SAMFFNet在强化人体结构特征与特征融合策略上的有效性。 展开更多
关键词 人体姿态估计 语义增强 上下文引导的注意力(CGA) 自适应特征融合 特征金字塔(FPN)
在线阅读 下载PDF
基于时空图卷积网络与多层次特征融合的快递员3D人体姿态估计
17
作者 丁德波 史耀群 《传感技术学报》 北大核心 2025年第8期1457-1462,共6页
将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,... 将快递员的人体动作数字化,赋能物流行业的智能化转型,从提升效率、保障健康到推动人机协作,具有广泛的应用潜力。提出了一种新方法,融合了时空图卷积网络与多层次特征融合技术。该方法首先利用时空图卷积网络对人体骨架序列进行建模,有效提取关节间的空间关系及时序依赖性。接着,通过引入多层次特征融合模块,融合来自不同网络层的特征信息,包括低层次的细节特征和高层次的抽象特征,从而更全面地捕捉快递员的人体关节动态变化和运动模式。为了验证所提方法的性能,在公开数据集Human3.6M上进行了实验。该数据集由视觉传感器采集得到,包含了丰富的人体姿态信息。仿真实验结果表明,所提出的方法能够显著提高三维姿态估计的精度。 展开更多
关键词 三维人体姿态估计 时空图卷积网络 多层次特征融合
在线阅读 下载PDF
基于大模型的钻井现场人体姿态估计方法研究 被引量:1
18
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
三维人体姿态和形状估计的分层注意力时空特征融合算法
19
作者 闫卓越 刘骊 +2 位作者 付晓东 刘利军 彭玮 《图学学报》 北大核心 2025年第4期746-755,共10页
基于单目视频的三维人体姿态和形状估计在虚拟试衣和影视特效制作等领域具有重要作用。针对基于单目视频的三维人体姿态和形状估计中的人体建模不充分、时空表征较单一、估计精准性受限的问题,提出三维人体姿态和形状估计的分层注意力... 基于单目视频的三维人体姿态和形状估计在虚拟试衣和影视特效制作等领域具有重要作用。针对基于单目视频的三维人体姿态和形状估计中的人体建模不充分、时空表征较单一、估计精准性受限的问题,提出三维人体姿态和形状估计的分层注意力时空特征融合算法。首先使用分层注意力对人体部位进行分层空间建模,得到可学习的人体姿态空间特征;然后将可学习的人体姿态空间特征与参数人体模板结合,共同指导人体运动时序特征进行时空建模,实现时空特征融合;最后提出三维人体姿态和形状联合优化方法,使用多层感知机回归更加精准且平滑的三维人体网格。在Human3.6M数据集上的实验结果表明,该方法在评估指标MPJPE和ACC-ERR上的数值分别为56.1 mm和3.4 mm/s^(2),较现有方法相比降低了0.5%和5.6%,能够提高三维人体姿态和形状估计的精度,生成精准且平滑的三维人体网格。此外,在3DPW数据集和互联网视频的测试结果表明,在面对快速运动等场景时,也具有一定的鲁棒性。 展开更多
关键词 三维人体姿态和形状估计 分层注意力 时空建模 时空特征融合 姿态和形状联合优化
在线阅读 下载PDF
教学场景下基于几何关系感知的人体姿态估计表示学习模型
20
作者 刘海 朱俊艳 +2 位作者 张昭理 周启云 宋云霄 《计算机工程》 北大核心 2025年第10期97-110,共14页
人体姿态估计(HPE)任务是计算机视觉领域中的一项重要研究工作,它在教学场景下有着广泛应用。当前该任务仍然面临着许多挑战,例如在背景杂乱、人体图像尺度小、人体被遮挡等复杂场景下出现准确率下降的问题,与此同时,人体姿态的灵活多... 人体姿态估计(HPE)任务是计算机视觉领域中的一项重要研究工作,它在教学场景下有着广泛应用。当前该任务仍然面临着许多挑战,例如在背景杂乱、人体图像尺度小、人体被遮挡等复杂场景下出现准确率下降的问题,与此同时,人体姿态的灵活多变性则要求模型具有良好的推理预测能力。针对上述问题,提出一种几何关系感知的人体姿态表示学习模型,通过人体的结构化信息来帮助模型更好地理解不同姿态之间的关系,从而提高对复杂姿势预测的准确性和鲁棒性,实现其在课堂场景下的有效应用。该模型主要包括通道重加权、多token信息交互、肢体方向构建和自适应损失传播4个模块。肢体方向构建模块实现了对人体关节之间几何结构的建模,这一输入线索有利于模型捕捉到身体部位之间的相对位置和方向关系;通道重加权模块能够自动选择和强调对姿态估计任务最有帮助的特征信息,提升输入图像的视觉特征的表达能力;基于Transformer编码器的多token信息交互模块实现了图像特征线索、关节坐标线索和肢体方向线索之间的有效交互;最后,在自适应损失传播模块对传统的损失函数进行优化,进一步提高了模型的训练效果和性能。模型在2个主流数据集COCO和MPII上分别达到了76.1%、90.3%的准确率,超过了现有的一些SOTA(State of the Art)模型,在复杂场景下实现了更加准确合理的预测结果。 展开更多
关键词 人体姿态估计 几何结构线索 肢体方向 TRANSFORMER 图像理解
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部