期刊文献+
共找到107篇文章
< 1 2 6 >
每页显示 20 50 100
联合自注意力机制与权值共享的人体行为识别模型
1
作者 马仑 杨跃 +2 位作者 王迨贺 廖桂生 李幸 《系统仿真学报》 北大核心 2025年第9期2409-2419,共11页
随着可穿戴设备的普及,基于可穿戴传感器的人体行为识别已被广泛关注。如何从原始传感器数据中提取较为有效的行为信息并组成相应特征向量,是该领域的核心问题。目前,卷积和循环神经网络已广泛用于多传感器数据的特征提取,然而这些网络... 随着可穿戴设备的普及,基于可穿戴传感器的人体行为识别已被广泛关注。如何从原始传感器数据中提取较为有效的行为信息并组成相应特征向量,是该领域的核心问题。目前,卷积和循环神经网络已广泛用于多传感器数据的特征提取,然而这些网络难以站在全局角度关注到人体行为沿时间维度具有的重要特征。为此,在考虑到布设于人体不同部位传感器存在的逻辑相关性后,提出了一个基于自注意力机制与权值共享的多分支人体行为识别模型(Multi-CNN-BiLSTM-self attention,Multi-CBSA)。该模型使用架构统一且权值一致的子网络提取人体不同部位行为数据的特征,从而简化模型结构并减少模型训练参数。同时,每个子网络利用一维卷积将原始行为数据转换为由高级特征组成的短序列,通过双向长短期记忆网络获取短序列的前后向时序特征,利用自注意力机制将提取到的行为特征进行动态权值分配,获取具有代表性的关键特征,每个子网络输出将在融合层进行特征融合。消融实验表明:在引入自注意力机制后,Multi-CBSA在收敛速度、验证集损失、以及单类行为识别准确率上都有提升。对比实验表明,Multi-CBSA可以在减少训练参数量的基础上将MHEALTH和PAMAP2数据集的识别准确率提高到99.3%和96.4%,相较于近年表现较好的模型,识别准确率最大可以提高4.2%和4.4%。 展开更多
关键词 人体行为识别 可穿戴传感器 特征提取 自注意力机制 权值共享
在线阅读 下载PDF
ASGC-STT:基于自适应空间图卷积和时空Transformer的人体行为识别 被引量:1
2
作者 庄添铭 秦臻 +1 位作者 耿技 张瀚文 《计算机应用研究》 北大核心 2025年第4期1239-1247,共9页
近年来许多行为识别研究将人体骨架建模为拓扑图,并利用图卷积网络提取动作特征。然而,拓扑图在训练过程中固有的共享和静态特征限制了模型的性能。为解决该问题,提出基于自适应空间图卷积和时空Transformer的人体行为识别方法—ASGC-ST... 近年来许多行为识别研究将人体骨架建模为拓扑图,并利用图卷积网络提取动作特征。然而,拓扑图在训练过程中固有的共享和静态特征限制了模型的性能。为解决该问题,提出基于自适应空间图卷积和时空Transformer的人体行为识别方法—ASGC-STT。首先,提出了一种非共享图拓扑的自适应空间图卷积网络,该图拓扑在不同网络层中是唯一的,可以提取更多样化的特征,同时使用多尺度时间卷积来捕获高级时域特征。其次,引入了一种时空Transformer模块,能够准确捕捉远距离的帧内和帧间任意关节之间的相关性,建模包含局部和全局关节关系的动作表示。最后,设计了一种多尺度残差聚合模块,通过分层残差结构设计来有效扩大感受野范围,捕获空间和时间域的多尺度依赖关系。ASGC-STT在大规模数据集NTU-RGB+D 60上的准确率为92.7%(X-Sub)和96.9%(X-View),在NTU-RGB+D 120上的准确率为88.2%(X-Sub)和89.5%(X-Set),在Kinetics Skeleton 400上的准确率为38.6%(top-1)和61.4%(top-5)。实验结果表明,ASGC-STT在人体行为识别任务中具有优越的性能和通用性。 展开更多
关键词 人体行为识别 时空特征 图卷积网络 多尺度建模
在线阅读 下载PDF
基于双通道图卷积网络的人体行为识别方法 被引量:1
3
作者 商樊淇 李志新 +3 位作者 郇战 陈瑛 王永松 梁久祯 《传感器与微系统》 北大核心 2025年第3期138-142,共5页
通过可穿戴传感器识别人体行为受到了广泛关注。现有的方法忽略了个体行为数据之间的潜在关系,尤其不能处理类内差异和类间相似的问题。为了解决这一限制,本文提出了具有特征相似性和个人特点的双通道混合图卷积网络(GCN)。一个通道通... 通过可穿戴传感器识别人体行为受到了广泛关注。现有的方法忽略了个体行为数据之间的潜在关系,尤其不能处理类内差异和类间相似的问题。为了解决这一限制,本文提出了具有特征相似性和个人特点的双通道混合图卷积网络(GCN)。一个通道通过特征图收集相似的活动信息,另一个通道根据个人特征图挖掘个人习惯对人类活动的内在影响。考虑到不同数据分布的差异,引入自注意机制对双通道进行加权,并根据不同的输入数据自适应调整两种拓扑的重要性,以提高网络的泛化性能。为了评估所提出的模型的性能,在UCI-HAR和WISDM数据集上进行了实验验证。结果表明:HSP-GCN的性能优于对比神经网络,F1分别为98.4%和96.5%,与现有工作相比有显著提高。 展开更多
关键词 深度学习 人体行为识别 图卷积神经网络
在线阅读 下载PDF
基于散射分离的多通道雷达人体行为识别方法
4
作者 李未一 杨健 +2 位作者 方旖 贾勇 张伟 《电波科学学报》 北大核心 2025年第1期172-183,共12页
人体目标相对于雷达呈现典型的多散射特性,强散射的躯干部位回波会掩盖四肢和头部等弱散射部位回波,限制了行为识别性能。基于此,本文提出一种基于散射分离的多通道雷达人体行为识别方法。首先,将多个收发通道的人体回波数据堆叠后进行... 人体目标相对于雷达呈现典型的多散射特性,强散射的躯干部位回波会掩盖四肢和头部等弱散射部位回波,限制了行为识别性能。基于此,本文提出一种基于散射分离的多通道雷达人体行为识别方法。首先,将多个收发通道的人体回波数据堆叠后进行主成分分析,强散射躯干和弱散射四肢头部被分离到前两个分量中,避免了掩盖影响;然后分别进行短时傅里叶变换得到对应躯干和四肢头部运动的时频谱图,共同对人体行为进行特征表达;最后分别计算谱图的方向梯度直方图特征,拼接形成人体行为特征,输入支持向量机完成识别。利用2发4收步进变频雷达采集6种行为的数据集,测试结果表明,相比于未散射分离,该方法的平均识别率提升了4.26%,行为特征得到充分表达,为人体行为识别提供了新的思路。 展开更多
关键词 散射分离 多通道雷达 人体行为识别 主成分分析(PCA) 支持向量机(SVM)
在线阅读 下载PDF
基于多模态数据的人体行为识别方法研究综述 被引量:3
5
作者 王彩玲 闫晶晶 张智栋 《计算机工程与应用》 CSCD 北大核心 2024年第9期1-18,共18页
人体行为识别广泛应用于智能安防、自动驾驶和人机交互等领域。随着拍摄设备和传感器技术的发展,可获取用于人体行为识别的数据不再局限于RGB数据,还有深度、骨骼和红外等多模态数据。详细介绍了基于RGB和骨骼数据模态的人体行为识别任... 人体行为识别广泛应用于智能安防、自动驾驶和人机交互等领域。随着拍摄设备和传感器技术的发展,可获取用于人体行为识别的数据不再局限于RGB数据,还有深度、骨骼和红外等多模态数据。详细介绍了基于RGB和骨骼数据模态的人体行为识别任务中特征提取方法,包括基于手工标注和基于深度学习的方法。对于RGB数据模态,重点分析了基于双流卷积神经网络、3D卷积神经网络和混合网络的特征提取算法。对于骨骼数据模态,介绍了目前流行的单人和多人姿态评估算法;重点分析了基于卷积神经网络、循环神经网络和图卷积神经网络的分类算法;进一步全面展示了两种数据模态的通用数据集。此外,基于RGB和骨骼各自的数据结构特征,探讨了目前面临的挑战,最后对未来基于深度学习的人体行为识别方法的研究方向进行了展望。 展开更多
关键词 视频理解 人体行为识别 深度学习 特征提取 姿态评估算法
在线阅读 下载PDF
基于混合特征图卷积神经网络的人体行为识别方法 被引量:2
6
作者 李志新 商樊淇 +2 位作者 郇战 陈瑛 梁久祯 《郑州大学学报(工学版)》 CAS 北大核心 2024年第4期46-52,共7页
基于可穿戴传感器的人体行为识别方法不能很好地处理时间序列数据采样点之间的结构信息,也忽略了数据样本之间的潜在联系。针对这一问题,提出了混合时频特征和结构特征的图卷积神经网络模型进行人体动作识别。首先,通过小波包变换获取... 基于可穿戴传感器的人体行为识别方法不能很好地处理时间序列数据采样点之间的结构信息,也忽略了数据样本之间的潜在联系。针对这一问题,提出了混合时频特征和结构特征的图卷积神经网络模型进行人体动作识别。首先,通过小波包变换获取原始信号的时频特征,进一步构建时空图提取信号的结构特征以挖掘采样点间的动态特性,并在结构特征中加入距离约束,弱化时空图中远距离邻居对中心节点的影响。其次,考虑到结构特征提取时受时空图拓扑关系影响较大,选择样本的时频特征构造图卷积神经网络的输入拓扑,混合时频特征和结构特征作为网络输入特征。最后,输入特征沿着输入拓扑结构传播,得到最终分类结果。为了评估所提模型的性能,在WHARF和DataEgo数据集上进行了实验验证。实验结果表明:所提模型的F1分数相比已有的基于卷积神经网络模型在WHARF和DataEgo上均有提升,WHARF数据集上F1最高提升19.58百分点,DataEgo数据集上F1最高提升26.44百分点,证明所提出模型通过挖掘动态特性能够有效提高动作识别能力。 展开更多
关键词 图卷积神经网络 可穿戴设备 人体行为识别 时空图 特征提取
在线阅读 下载PDF
基于骨架关键关节构建时空金字塔模型的人体行为识别 被引量:1
7
作者 司宇航 周天彤 冯珂垚 《计算机应用与软件》 北大核心 2024年第1期153-160,共8页
针对当前骨骼数据信噪比低及特征信息不足的问题,提出人体关键关节构建时空金字塔模型的动作识别方法。该算法利用人体骨架关键关节构建空间域金字塔特征,保留骨架铰链系统的空间结构;利用多层级叠加协方差,构建时序金字塔特征,解决需... 针对当前骨骼数据信噪比低及特征信息不足的问题,提出人体关键关节构建时空金字塔模型的动作识别方法。该算法利用人体骨架关键关节构建空间域金字塔特征,保留骨架铰链系统的空间结构;利用多层级叠加协方差,构建时序金字塔特征,解决需要预处理视频序列长度的问题。在MSR-Action3D和UTKinect数据集上的实验结果表明,该方法准确率高、实时性好,可广泛应用于行为识别的各个领域。 展开更多
关键词 人体行为识别 3D骨骼数据 时空金字塔模型 关键关节
在线阅读 下载PDF
基于双流-非局部时空残差卷积神经网络的人体行为识别 被引量:4
8
作者 钱惠敏 陈实 皇甫晓瑛 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1100-1108,共9页
3维卷积神经网络(3D CNN)与双流卷积神经网络(two-stream CNN)是视频中人体行为识别研究的常用架构,且各有优势。该文旨在研究结合两种架构且复杂度低、识别精度高的人体行为识别模型。具体地,该文提出基于通道剪枝的双流-非局部时空残... 3维卷积神经网络(3D CNN)与双流卷积神经网络(two-stream CNN)是视频中人体行为识别研究的常用架构,且各有优势。该文旨在研究结合两种架构且复杂度低、识别精度高的人体行为识别模型。具体地,该文提出基于通道剪枝的双流-非局部时空残差卷积神经网络(TPNLST-ResCNN),该网络采用双流架构,分别在时间流子网络和空间流子网络采用时空残差卷积神经网络(ST-ResCNN),并采用均值融合算法融合两个子网络的识别结果。进一步地,为了降低网络的复杂度,该文提出了针对时空残差卷积神经网络的通道剪枝方案,在实现模型压缩的同时,可基本保持模型的识别精度;为了使得压缩后网络能更好地学习到输入视频中人体行为变化的长距离时空依赖关系,提高网络的识别精度,该文提出在剪枝后网络的首个残差型时空卷积块前引入一个非局部模块。实验结果表明,该文提出的人体行为识别模型在公共数据集UCF101和HMDB51上的识别准确率分别为98.33%和74.63%。与现有方法相比,该文模型具有参数量小、识别精度高的优点。 展开更多
关键词 人体行为识别 双流卷积神经网络 3维卷积神经网络 网络剪枝 非局部模块
在线阅读 下载PDF
基于时频域特征融合的IR-UWB穿墙雷达人体行为识别方法 被引量:1
9
作者 杨德贵 许道峰 《系统工程与电子技术》 EI CSCD 北大核心 2024年第3期849-858,共10页
冲激脉冲(impulse radio,IR)超宽带(ultra-wideband,UWB)穿墙雷达因其良好的穿透性和距离分辨率在穿墙人体行为识别领域具有重要作用,但是常规识别方法仅采用单域特征对行为模式进行描述,识别准确率不高。针对这一问题,提出基于时频域... 冲激脉冲(impulse radio,IR)超宽带(ultra-wideband,UWB)穿墙雷达因其良好的穿透性和距离分辨率在穿墙人体行为识别领域具有重要作用,但是常规识别方法仅采用单域特征对行为模式进行描述,识别准确率不高。针对这一问题,提出基于时频域特征融合的IR-UWB穿墙雷达人体行为识别算法。首先,通过杂波抑制及距离补偿方法获取高信噪比的人体行为距离像。其次,基于距离像提取目标时域特征,与频域特征进行融合,构建数据集。最后,基于支持向量机(support vector machine,SVM)算法对人体行为进行识别。实验结果表明,所提算法对于IR-UWB穿墙雷达人体行为识别能够达到95%的准确率。 展开更多
关键词 人体行为识别 冲激脉冲超宽带雷达 特征提取 支持向量机
在线阅读 下载PDF
基于双重时空特征金字塔的人体行为识别 被引量:1
10
作者 李贵 袁家政 +1 位作者 刘宏哲 徐成 《传感器与微系统》 CSCD 北大核心 2024年第4期132-135,共4页
针对目前人体动作存在着行为识别准确率低的问题,提出一种基于双重时空特征金字塔网络结构的人体行为识别方法—DSTFP。该方法使用SlowFast网络作为骨干网络提取不同尺度的特征,并将多个尺度的特征输入双重时空特征金字塔进行处理以增... 针对目前人体动作存在着行为识别准确率低的问题,提出一种基于双重时空特征金字塔网络结构的人体行为识别方法—DSTFP。该方法使用SlowFast网络作为骨干网络提取不同尺度的特征,并将多个尺度的特征输入双重时空特征金字塔进行处理以增加网络对多个尺度的敏感度。第一重为语义增强金字塔(SEEP),自顶向下融合多个尺度的特征,在不同尺度的特征中传递高层语义信息;第二重为空间增强金字塔(SPEP),采用自底向上的融合方式,在不同尺度的特征中传递空间定位信息。在公共数据集AVA上的实验结果表明:该方法能获得24.97 mAP,相较于原网络提升了0.77 mAP,并有效地提升了人体行为识别的准确度,相比于同类算法更符合实际应用需求。 展开更多
关键词 神经网络 特征金字塔 多尺度融合 人体行为识别 视频理解
在线阅读 下载PDF
基于WGAN-GP和Mean Teacher的WiFi使能跨域人体行为识别
11
作者 史心玥 夏文超 +3 位作者 赵海涛 杨丽花 阮欣雨 常天水 《无线电通信技术》 北大核心 2024年第6期1192-1199,共8页
人体行为识别(Human Activity Recognition,HAR)是当前众多研究工作的基石,对于推动人机交互和智能数字化转型具有巨大潜力。由于目标域样本较难采集,现有方法在跨域识别方面表现不佳。为解决这一问题,提出一种新的WiFi使能跨域HAR方法,... 人体行为识别(Human Activity Recognition,HAR)是当前众多研究工作的基石,对于推动人机交互和智能数字化转型具有巨大潜力。由于目标域样本较难采集,现有方法在跨域识别方面表现不佳。为解决这一问题,提出一种新的WiFi使能跨域HAR方法,从WiFi信号中获取信道状态信息(Channel State Information,CSI)并转化为图像,在基于Wasserstein距离和梯度的生成对抗网络(Wasserstein Generative Adversarial Network with Gradient Penalty,WGAN-GP)中引入双判别器,通过与源域样本和单目标域样本特征联合对抗,生成同时带有双域特征的虚拟样本。该方法还结合基于Mean Teacher的半监督学习设计识别分类(Recognition and Classification,RC)模块,通过对有标记样本与无标记样本分别构造损失函数,进行整体一致性损失的评估,实现对目标域样本的识别。实验结果证明了所提方法能够在减轻目标域样本采集压力的同时,实现较高的检测精度,在手势与动作的数据集上测试准确率分别达到92.71%和86.65%。 展开更多
关键词 人体行为识别 生成对抗网络 Mean Teacher模型 跨域识别
在线阅读 下载PDF
基于深度学习的人体行为识别方法综述 被引量:34
12
作者 蔡强 邓毅彪 +2 位作者 李海生 余乐 明少锋 《计算机科学》 CSCD 北大核心 2020年第4期85-93,共9页
人体行为识别作为计算机视觉领域的重要研究热点,在智能监控、智能家居、虚拟现实等诸多领域中具有重要的研究意义和广泛的应用前景,备受国内外学者的关注。基于传统手工特征的方法难以处理复杂场景下的人体行为识别。随着深度学习在图... 人体行为识别作为计算机视觉领域的重要研究热点,在智能监控、智能家居、虚拟现实等诸多领域中具有重要的研究意义和广泛的应用前景,备受国内外学者的关注。基于传统手工特征的方法难以处理复杂场景下的人体行为识别。随着深度学习在图像分类方面取得巨大成功,将深度学习用于人体行为识别方法中已逐渐成为一种发展趋势,但其仍然存在一些困难与挑战。首先,根据特征提取方法的不同,简单回顾了早期基于传统手工特征的行为识别方法;然后,从网络结构的角度着重对近年来一些基于深度学习的人体行为识别方法进行论述和分析,其中包括目前常用的双流网络架构和三维卷积网络架构等;另外,还介绍了目前用于评价方法性能的人体行为识别数据集,同时总结了部分典型方法在UCF-101和HMDB51两个著名的公开数据集上的性能;最后,从性能和应用两个方面对基于深度学习的人体行为识别方法的未来发展方向进行了展望,并指出了当前方法存在的不足之处。 展开更多
关键词 人体行为识别 深度学习 卷积神经网络 人体行为识别数据集
在线阅读 下载PDF
基于多学习器协同训练模型的人体行为识别方法 被引量:10
13
作者 唐超 王文剑 +2 位作者 李伟 李国斌 曹峰 《软件学报》 EI CSCD 北大核心 2015年第11期2939-2950,共12页
人体行为识别是计算机视觉研究的热点问题,现有的行为识别方法都是基于监督学习框架.为了取得较好的识别效果,通常需要大量的有标记样本来建模.然而,获取有标记样本是一个费时又费力的工作.为了解决这个问题,对半监督学习中的协同训练... 人体行为识别是计算机视觉研究的热点问题,现有的行为识别方法都是基于监督学习框架.为了取得较好的识别效果,通常需要大量的有标记样本来建模.然而,获取有标记样本是一个费时又费力的工作.为了解决这个问题,对半监督学习中的协同训练算法进行改进,提出了一种基于多学习器协同训练模型的人体行为识别方法.这是一种基于半监督学习框架的识别算法.该方法首先通过基于Q统计量的学习器差异性度量选择算法来挑取出协同训练中基学习器集,在协同训练过程中,这些基学习器集对未标记样本进行标记;然后,采用了基于分类器成员委员会的标记近邻置信度计算公式来评估未标记样本的置信度,选取一定比例置信度较高的未标记样本加入到已标记的训练样本集并更新学习器来提升模型的泛化能力.为了评估算法的有效性,采用混合特征来表征人体行为,从而可以快速完成识别过程.实验结果表明,所提出的基于半监督学习的行为识别系统可以有效地辨识视频中的人体动作. 展开更多
关键词 人体行为识别 半监督学习 协同训练 学习器选择 混合特征
在线阅读 下载PDF
深度图像与骨骼数据的多特征融合人体行为识别 被引量:10
14
作者 许艳 侯振杰 +3 位作者 梁久祯 陈宸 贾靓 莫宇剑 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1865-1870,共6页
运动人体的行为分析与识别是智能监控中的关键技术,研究有效的人体行为对智能视频推广与应用具有重要意义.为发挥深度图像与骨骼数据的优越性,将深度特征与骨骼特征结合进行人体行为识别,提出一种基于深度信息和骨骼数据的特征融合的人... 运动人体的行为分析与识别是智能监控中的关键技术,研究有效的人体行为对智能视频推广与应用具有重要意义.为发挥深度图像与骨骼数据的优越性,将深度特征与骨骼特征结合进行人体行为识别,提出一种基于深度信息和骨骼数据的特征融合的人体行为识别方法.在深度图像方面捕捉行为线索,提取人体行为梯度、轮廓曲率的几何特征;在骨骼数据方面提取运动节点的多种特征,用人体行为轮廓比、角度差和距离差表征行为形态,达到结果只与行为分布有关的目的;运用一种多模型概率投票的识别分类机制,减小噪声对实验结果的影响.实验表明,该方法能够有效识别人体行为. 展开更多
关键词 深度图像 骨骼数据 人体行为识别 运动节点
在线阅读 下载PDF
复杂场景下的人体行为识别研究新进展 被引量:16
15
作者 雷庆 陈锻生 李绍滋 《计算机科学》 CSCD 北大核心 2014年第12期1-7,共7页
人体行为识别是计算机视觉的研究难点和热点,主流的研究框架包括行为特征提取、人体行为表示和识别算法3个方面,目前简单场景下的人体简单动作的识别已基本得到解决,而复杂场景下的行为识别仍面临很多困难。对近几年人体行为识别的发展... 人体行为识别是计算机视觉的研究难点和热点,主流的研究框架包括行为特征提取、人体行为表示和识别算法3个方面,目前简单场景下的人体简单动作的识别已基本得到解决,而复杂场景下的行为识别仍面临很多困难。对近几年人体行为识别的发展做了比较详细的研究,从人体行为识别的研究范畴、特征提取以及行为模型等方面综述了目前复杂场景下人体行为识别的研究方法。与已有的相关综述文献不同的是,文中结合了近三年国内外人体行为识别领域中新的研究热点和成果,如姿态特征的提取和表示、基于稀疏编码和卷积神经网络的人体行为表示方法等。最后阐述了该领域目前存在的困难以及可能的发展趋向。 展开更多
关键词 人体行为识别 行为特征提取 行为表示 计算机视觉
在线阅读 下载PDF
基于MEMS惯性传感器时域特征的人体行为识别 被引量:8
16
作者 谢国亚 刘宇 +3 位作者 路永乐 邸克 郭俊启 余跃 《压电与声光》 CAS 北大核心 2019年第2期221-224,共4页
提出了一种基于微机电系统(MEMS)惯性传感器组合系统的高精度实时人体行为识别算法。算法选取一个2 s的滑动时间窗作为特征提取窗口,提取惯性传感器组合系统输出的时域特征作为特征参量,采用基于平衡决策树的支持向量机对人体不同行为... 提出了一种基于微机电系统(MEMS)惯性传感器组合系统的高精度实时人体行为识别算法。算法选取一个2 s的滑动时间窗作为特征提取窗口,提取惯性传感器组合系统输出的时域特征作为特征参量,采用基于平衡决策树的支持向量机对人体不同行为模式进行分类识别。在实验室自主研发的可穿戴智能终端平台上进行测试,结果表明,在识别时间缩短到2 s/次的条件下,对5种行走类行为模式和5种非行走类行为模式的识别率均可达88%。与现有算法相比,该算法的实时性和精度得到明显提高,且拓展了模式识别的种类。 展开更多
关键词 微机电系统(MEMS)惯性传感器 人体行为识别 特征提取 特征参量 支持向量机
在线阅读 下载PDF
基于3D双流卷积神经网络和GRU网络的人体行为识别 被引量:7
17
作者 陈颖 来兴雪 +2 位作者 周志全 秦晓宏 池亚平 《计算机应用与软件》 北大核心 2020年第5期164-168,218,共6页
针对基于双流卷积神经网络的人体行为识别准确率不高,不能充分利用时间维度的信息问题,提出一种基于3D双流卷积和门控循环单元(GRU)网络的人体行为识别模型。将3D卷积神经网络引入到双流卷积神经网络中,在双流卷积神经网络的空间流和时... 针对基于双流卷积神经网络的人体行为识别准确率不高,不能充分利用时间维度的信息问题,提出一种基于3D双流卷积和门控循环单元(GRU)网络的人体行为识别模型。将3D卷积神经网络引入到双流卷积神经网络中,在双流卷积神经网络的空间流和时间流中分别使用3D卷积神经网络提取视频的时空信息;融合3D双流卷积神经网络提取到的时空特征,形成有时间顺序的时空特征流;将时空特征流输入到具有记忆信息能力的GRU网络中递归学习时间维度的长时序列特征并利用线性SVM分类器进行人体行为识别。在行为识别数据集UCF101上的实验结果表明,该模型充分地利用了视频的时间维度信息,识别率为92.2%,优于其他人体行为识别算法。 展开更多
关键词 人体行为识别 3D卷积神经网络 双流卷积神经网络 门控循环单元
在线阅读 下载PDF
基于深度卷积神经网络和深度视频的人体行为识别 被引量:7
18
作者 刘智 冯欣 张杰 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第11期99-106,共8页
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,... 传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。 展开更多
关键词 深度学习 人体行为识别 深度卷积神经网络 深度视频 3维卷积
在线阅读 下载PDF
基于四元数时空卷积神经网络的人体行为识别 被引量:17
19
作者 孟勃 刘雪君 王晓霖 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第11期2643-2650,共8页
传统卷积神经网络(CNN)只适用于灰度图像或彩色图像分通道的特征提取,忽视了通道间的空间依赖性,破坏了真实环境的颜色特征,从而影响人体行为识别的准确率。为了解决上述问题,提出一种基于四元数时空卷积神经网络(QST-CNN)的人体行为识... 传统卷积神经网络(CNN)只适用于灰度图像或彩色图像分通道的特征提取,忽视了通道间的空间依赖性,破坏了真实环境的颜色特征,从而影响人体行为识别的准确率。为了解决上述问题,提出一种基于四元数时空卷积神经网络(QST-CNN)的人体行为识别方法。首先,采用码本算法预处理样本集所有图像,提取图像中人体运动的关键区域;然后将彩色图像的四元数矩阵形式作为网络的输入,并将CNN的空间卷积层扩展为四元数空间卷积层,将彩色图像的红、绿、蓝通道看作一个整体进行动作空间特征的提取,并在时间卷积层提取相邻帧的动态信息;最后,比较QST-CNN、灰度单通道CNN(Gray-CNN)和RGB 3通道CNN(3Channel-CNN)3种方法的识别率。实验结果表明,所提方法优于其他流行方法,在Weizmann和UCF sports数据集分别取得了85.34%和80.2%的识别率。 展开更多
关键词 四元数 卷积神经网络 码本 人体行为识别
在线阅读 下载PDF
融合空间-时间双网络流和视觉注意的人体行为识别 被引量:14
20
作者 刘天亮 谯庆伟 +2 位作者 万俊伟 戴修斌 罗杰波 《电子与信息学报》 EI CSCD 北大核心 2018年第10期2395-2401,共7页
该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚... 该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚合给定时间窗口视频中外观图像和相应光流特征。接着,利用长短时记忆多层递归网络交叉感知即得含高层显著结构的时空流语义特征序列;解码时间窗口内互相依赖的隐状态;输出空间流视觉特征描述和视频窗口中每帧标签概率分布。其次,利用相对熵计算时间维每帧注意力置信度,并融合空间网络流感知序列标签概率分布。最后,利用softmax分类视频中行为类别。实验结果表明,与其他现有方法相比,该文行为识别方法在分类准确度上具有显著优势。 展开更多
关键词 人体行为识别 光流 双重时空网络流 视觉注意力 卷积神经网络 长短时记忆神经网络
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部