期刊文献+
共找到915篇文章
< 1 2 46 >
每页显示 20 50 100
基于4D成像雷达的隔墙人体姿态重建与行为识别研究 被引量:1
1
作者 张锐 龚汉钦 +5 位作者 宋瑞源 李亚东 卢智 张东恒 胡洋 陈彦 《雷达学报(中英文)》 北大核心 2025年第1期44-61,共18页
隔墙人体姿态重建和行为识别在智能安防和虚拟现实等领域具有广泛应用前景。然而,现有隔墙人体感知方法通常忽视了对4D时空特征的建模以及墙体对信号的影响,针对这些问题,该文创新性地提出了一种基于4D成像雷达的隔墙人体感知新架构。首... 隔墙人体姿态重建和行为识别在智能安防和虚拟现实等领域具有广泛应用前景。然而,现有隔墙人体感知方法通常忽视了对4D时空特征的建模以及墙体对信号的影响,针对这些问题,该文创新性地提出了一种基于4D成像雷达的隔墙人体感知新架构。首先,基于时空分离的分步策略,该文设计了ST~2W-AP时空融合网络,解决了由于主流深度学习库缺少4D卷积而无法充分利用多帧3D体素时空域信息的问题,实现了保留3D空域信息的同时利用长序时域信息,大幅提升姿态估计任务和行为识别任务的性能。此外,为抑制墙体对信号的干扰,该文利用深度学习强大的拟合性能和并行输出的特点设计了深度回波域补偿器,降低了传统墙体补偿方法的计算开销。大量的实验结果表明,相比于现有最佳方法,ST~2W-AP将平均关节位置误差降低了33.57%,并且将行为识别的F1分数提高了0.51%。 展开更多
关键词 穿墙 人体姿态估计 行为识别 射频感知 深度学习
在线阅读 下载PDF
时空关键区域增强的小样本异常行为识别 被引量:1
2
作者 肖进胜 王澍瑞 +3 位作者 吴原顼 赵持恒 陈云华 章红平 《计算机学报》 北大核心 2025年第1期68-81,共14页
异常行为识别在维护社会安全稳定方面起着重要的作用,相比于常见的正常行为识别,它是一项更具挑战性的任务。其难点主要体现在:异常行为实际发生的概率较低,因此可用于训练的样本数目相对较少;监控视频中,包含判断性信息的异常行为特征... 异常行为识别在维护社会安全稳定方面起着重要的作用,相比于常见的正常行为识别,它是一项更具挑战性的任务。其难点主要体现在:异常行为实际发生的概率较低,因此可用于训练的样本数目相对较少;监控视频中,包含判断性信息的异常行为特征往往只存在于局部的关键区域中;异常行为时空变化复杂,导致连续地定位并利用关键区域特征变得更加困难。为了解决上述难题,本文提出时空关键区域增强的小样本异常行为识别方法,通过学习大规模正常行为数据集中的共性知识实现对数量较少的异常行为的识别,并选取视频中的关键区域对异常行为特征进行增强。特征向量由于其中的信息被压缩,而难以准确地定位关键区域,本文创新性地挖掘特征图中的二维空间信息,以自适应地选取异常行为的关键区域。单个的视频帧很难反映行为的变化情况,因此需要根据时空信息动态地选取关键区域。本文提出在特征图级别将长时间范围内的时序信息和短时间范围内的运动信息进行关联,以使关键区域有效地捕捉异常行为的连续变化。最后提出时空精细化小样本损失函数,以保证模型有效学习到在时间和空间中更精细化等级的特征。本文在HMDB51、Kinetics以及UCF Crime v2数据集上进行了实验,结果证明本文方法识别效果优于其他方法,在异常行为数据集上相对于最强的竞争者准确率提升了0.6%。 展开更多
关键词 异常行为识别 小样本学习 关键区域增强 时空精细化损失 时空关联
在线阅读 下载PDF
一种基于WiFi信道状态信息的课堂行为识别方法 被引量:1
3
作者 杨彦侃 马鑫宇 郁林 《电子测量技术》 北大核心 2025年第3期118-127,共10页
学生课堂行为识别在提升教学质量方面具有重要意义。当前主流的研究大多基于视频或传感器技术,然而这些方法存在隐私侵犯、成本高昂等问题,制约了其广泛应用。为此,本文提出了一种基于WiFi CSI的学生课堂行为识别方法。该方法首先在真... 学生课堂行为识别在提升教学质量方面具有重要意义。当前主流的研究大多基于视频或传感器技术,然而这些方法存在隐私侵犯、成本高昂等问题,制约了其广泛应用。为此,本文提出了一种基于WiFi CSI的学生课堂行为识别方法。该方法首先在真实教室环境中采集了4种典型课堂行为(举手、起立、坐下、翻书)的CSI信号;然后结合WiFi CSI数据特点,采用Hampel滤波和小波变换对CSI信号进行去噪处理,并设计主成分分析算法融合所有子载波特征。随后,根据融合特征设计局部异常因子检测算法截取CSI动作区间,并引入三维映射的方式将截取的CSI信号转换成振幅能量图;最后设计了一种基于残差网络的迁移学习模型,对振幅能量图数据集进行特征提取和分类识别。实验结果表明,该方法在阶梯教室和小教室中的准确率分别为98.89%和99.07%,并且在对不同人员的测试中均可达到98%以上,证明该方法具有较高的识别精度和较好的鲁棒性,为学生课堂行为识别的研究提供了一种新的思路。 展开更多
关键词 WIFI 信道状态信息 行为识别 迁移学习 残差网络
在线阅读 下载PDF
基于改进YOLOv8算法的在线听课行为识别模型研究 被引量:1
4
作者 李猛坤 袁晨 +3 位作者 王琪 赵冲 陈景轩 刘立峰 《计算机工程》 北大核心 2025年第1期287-294,共8页
目前目标检测技术日趋成熟,但是针对在线听课行为的识别仍存在挑战。针对在线课堂人为监管力度不足、目标检测模型复杂度较高所导致的在线课堂行为识别不精准、模型计算量较高等问题,提出一种基于改进的YOLOv8在线听课行为检测与识别方... 目前目标检测技术日趋成熟,但是针对在线听课行为的识别仍存在挑战。针对在线课堂人为监管力度不足、目标检测模型复杂度较高所导致的在线课堂行为识别不精准、模型计算量较高等问题,提出一种基于改进的YOLOv8在线听课行为检测与识别方法。首先在YOLOv8n的基础上添加BiFPN双向特征金字塔网络来进行特征融合,以增加特征提取的能力,提高模型识别准确度;其次在Head端采用C3Ghost模块替代C2f模块,以大幅减少模型计算量。实验结果表明,提出的YOLOv8n-BiFPN-C3Ghost模型在线上听课行为数据集上的mAP@0.5和mAP@0.5∶0.95指标分别为98.6%和92.6%,相比其他课堂行为识别模型在精度上最高提升了4.2%和5.7%,计算量为6.6 GFLOPS,比原模型降低了19.5%。YOLOv8n-BiFPN-C3Ghost模型能以更低的运算成本精确地实现在线听课行为的检测和识别,可以实现对学生在线课堂学习情况的动态、科学识别。 展开更多
关键词 目标检测 在线课堂 听课行为识别 性能优化 特征融合
在线阅读 下载PDF
基于多任务Informer模型的船舶轨迹预测及行为识别研究
5
作者 李世刚 刘克中 +3 位作者 陈立家 周乃祺 周阳 黄嘉韬 《中国航海》 北大核心 2025年第3期157-165,共9页
为有效预判航行风险,并为船舶避碰、交通管理等决策提供重要依据,研究了一种基于多任务Informer模型的船舶轨迹预测及行为识别模型。该模型以Informer框架为基础,并引入多任务学习模式,通过设计多任务损失函数将船舶行为识别与轨迹预测... 为有效预判航行风险,并为船舶避碰、交通管理等决策提供重要依据,研究了一种基于多任务Informer模型的船舶轨迹预测及行为识别模型。该模型以Informer框架为基础,并引入多任务学习模式,通过设计多任务损失函数将船舶行为识别与轨迹预测并联训练,解决了AIS数据中船舶行为不准确无法作为模型输入的问题;在模型训练时,并设计基于同方差不确定性的损失函数自适应更新策略,自适应分配两个任务的损失权重。利用太仓航段水域中的真实AIS数据进行试验中多任务的Informer船舶轨迹预测模型在轨迹预测中的损失比LSTM和Informer模型分别降低了40.2%和14.7%;在行为识别任务中多任务模型的识别准确率比LSTM和Informer模型分别提升了11.7%和5.95%。表明了多任务模型能在有效提升船舶轨迹预测的性能的同时实现船舶对行为的准确识别。 展开更多
关键词 轨迹预测 行为识别 AIS数据 Informer模型 多任务学习
在线阅读 下载PDF
基于巡检机器人和改进RT-DETR的奶牛挑食行为识别方法
6
作者 田富洋 张立印 +3 位作者 张帅扬 宋占华 于镇伟 张姬 《农业机械学报》 北大核心 2025年第6期258-267,共10页
针对目前复杂环境下奶牛在采食过程中挑食行为与采食行为差异不大、识别精度较低、人工识别劳动强度大等问题,本文提出了一种基于巡检机器人和改进RT-DETR模型的奶牛挑食行为识别方法。根据奶牛采食特性设计巡检机器人采集奶牛采食过程... 针对目前复杂环境下奶牛在采食过程中挑食行为与采食行为差异不大、识别精度较低、人工识别劳动强度大等问题,本文提出了一种基于巡检机器人和改进RT-DETR模型的奶牛挑食行为识别方法。根据奶牛采食特性设计巡检机器人采集奶牛采食过程数据,分中午、下午和晚上3个时间段分别在3个牛棚进行采集,最终构建包含3个时间段共计10280幅奶牛采食数据集。对RT-DETR模型进行改进,在RT-DETR模型浅层中引入DAttention(DAT)模块和Bi-Level Routing Attention(BRA)模块融合的DBRA结构,建立了新的图像特征提取结构,提升输入图像局部和全局特征深度融合能力;在RT-DETR模型编码器中融合Efficient Multi-Scale Attention(EMA)模块,增强了提取高层次语义信息能力,更好地联系上下文信息。试验结果表明,改进后模型在奶牛采食视频数据集平均精度均值(mAP@0.5)为99.1%,模型内存占用量为39.6 MB,浮点计算量为4.67×10^(10),相较于原模型平均精度均值提高7.4个百分点,模型内存占用量降低0.9 MB,浮点计算量减少2%。与Sparse R-CNN、YOLO v7-L、YOLO v8n、DINO、Swin Transformer和DETR模型相比,平均精度均值(mAP@50)分别提高8.5、9.8、7.8、6.6、11.4、9.5个百分点。研究结果可以为实现畜牧养殖智能化提供技术支持。 展开更多
关键词 奶牛挑食行为 巡检机器人 改进RT-DETR 行为识别 注意力机制
在线阅读 下载PDF
基于多重信息自注意力的综采工作面目标行为识别
7
作者 杨艺 杨艳磊 +1 位作者 王田 王科平 《煤炭学报》 北大核心 2025年第2期1425-1442,共18页
综采工作面关键设备和人员的行为识别是开采环境信息智能感知的基础和核心。然而,综采工作面光照条件普遍较差,煤尘和水雾等干扰容易引起视频画面模糊,导致识别目标行为的关键特征难以提取,使得设备和人员的行为识别准确度无法达到实际... 综采工作面关键设备和人员的行为识别是开采环境信息智能感知的基础和核心。然而,综采工作面光照条件普遍较差,煤尘和水雾等干扰容易引起视频画面模糊,导致识别目标行为的关键特征难以提取,使得设备和人员的行为识别准确度无法达到实际工程应用的标准。为此,基于ResT网络架构,建立一种包含空间、时间、通道的多重信息自注意力模型和特征融合机制,扩展了模型特征提取的信息源,将其从单纯的空间信息扩展到空间、时间和通道的多重信息,提升了模型对目标行为的表征能力。其中,空间信息是对目标行为在空间上的深度解析,展现了目标的纹理、位置和形状等一系列深层特征;时间信息是从连续的视频帧中提取目标行为的时序特征,反映了行为发生的顺序以及演变关系;通道信息则是对空间和时间层面上的扩展与深入,从多角度挖掘空间和时间信息,并将原始数据表征在特征通道上,提供了目标行为的全局特征。算法的有效性在综采工作面行为识别数据集上进行了验证和对比试验。结果表明:在真实综采工作面环境下,行为识别的准确度可达到96.90%。相较于Swin-Transformer、Timesformer等主流的行为识别算法,识别准确率分别提升了11.06%和10.62%。算法经过ONNX模型转换和TensorRT加速后,在GPU上实现了推理,具备工程应用价值。据此,研发了综采工作面行为识别系统,并将算法模型以插件的形式嵌入到行为识别系统的Pipeline中,实现在DeepStream框架下对综采工作面关键设备和人员行为的实时推理和准确识别。 展开更多
关键词 工作面 行为识别 空间−时间−通道信息 网络模型 工程部署
在线阅读 下载PDF
联合自注意力机制与权值共享的人体行为识别模型
8
作者 马仑 杨跃 +2 位作者 王迨贺 廖桂生 李幸 《系统仿真学报》 北大核心 2025年第9期2409-2419,共11页
随着可穿戴设备的普及,基于可穿戴传感器的人体行为识别已被广泛关注。如何从原始传感器数据中提取较为有效的行为信息并组成相应特征向量,是该领域的核心问题。目前,卷积和循环神经网络已广泛用于多传感器数据的特征提取,然而这些网络... 随着可穿戴设备的普及,基于可穿戴传感器的人体行为识别已被广泛关注。如何从原始传感器数据中提取较为有效的行为信息并组成相应特征向量,是该领域的核心问题。目前,卷积和循环神经网络已广泛用于多传感器数据的特征提取,然而这些网络难以站在全局角度关注到人体行为沿时间维度具有的重要特征。为此,在考虑到布设于人体不同部位传感器存在的逻辑相关性后,提出了一个基于自注意力机制与权值共享的多分支人体行为识别模型(Multi-CNN-BiLSTM-self attention,Multi-CBSA)。该模型使用架构统一且权值一致的子网络提取人体不同部位行为数据的特征,从而简化模型结构并减少模型训练参数。同时,每个子网络利用一维卷积将原始行为数据转换为由高级特征组成的短序列,通过双向长短期记忆网络获取短序列的前后向时序特征,利用自注意力机制将提取到的行为特征进行动态权值分配,获取具有代表性的关键特征,每个子网络输出将在融合层进行特征融合。消融实验表明:在引入自注意力机制后,Multi-CBSA在收敛速度、验证集损失、以及单类行为识别准确率上都有提升。对比实验表明,Multi-CBSA可以在减少训练参数量的基础上将MHEALTH和PAMAP2数据集的识别准确率提高到99.3%和96.4%,相较于近年表现较好的模型,识别准确率最大可以提高4.2%和4.4%。 展开更多
关键词 人体行为识别 可穿戴传感器 特征提取 自注意力机制 权值共享
在线阅读 下载PDF
结合自适应局部图卷积与多尺度时间建模的骨架行为识别
9
作者 田青 虞静静 张正 《计算机应用研究》 北大核心 2025年第7期2199-2205,共7页
鉴于人体骨架的固有拓扑结构特性,采用图卷积网络进行骨架数据建模成为行为识别的一种有效手段。然而,在骨架行为识别方法中存在固定拓扑图结构与固定内核大小的时间卷积难以适应多变的动作类型、姿态及行为时长,导致建模误差,影响识别... 鉴于人体骨架的固有拓扑结构特性,采用图卷积网络进行骨架数据建模成为行为识别的一种有效手段。然而,在骨架行为识别方法中存在固定拓扑图结构与固定内核大小的时间卷积难以适应多变的动作类型、姿态及行为时长,导致建模误差,影响识别精度的问题。为此,提出了一种结合自适应局部图卷积与多尺度时间建模的骨架行为识别方法。该方法通过自适应局部图卷积模块,实现人体骨骼结构的独立动态表征;设计多尺度时间建模模块,实现对不同持续时间的行为进行建模,并降低了参数量和计算复杂度;引入时空DropGraph结构,动态调整图拓扑结构,提升模型的泛化能力并防止过拟合。实验表明,在NTU RGB+D 60数据集的跨对象C-Sub和跨视角C-View基准下分别取得了93.39%和97.18%的准确率,在NTU RGB+D 120数据集的跨对象C-Sub和跨设置C-Set基准下分别取得了90.48%和91.95%的准确率,高于现有的行为识别方法,证明了该方法的优越性。 展开更多
关键词 局部图卷积 自适应图 多尺度时间建模 行为识别
在线阅读 下载PDF
基于位置敏感的TimeSformer的群养猪攻击行为识别
10
作者 陈晨 韩丁磊 +3 位作者 Juan Steibel Janice Siegford 韩俊杰 Tomas Norton 《中国农机化学报》 北大核心 2025年第12期121-127,共7页
猪的攻击行为与其健康状况紧密相关,及时地识别猪攻击对现代养殖产业至关重要。目前,猪攻击识别研究主要分为群体级和成对级两类。然而,尝试从个体级角度进一步细化猪的攻击识别,因而提出一种基于位置敏感的TimeSformer的猪个体攻击行... 猪的攻击行为与其健康状况紧密相关,及时地识别猪攻击对现代养殖产业至关重要。目前,猪攻击识别研究主要分为群体级和成对级两类。然而,尝试从个体级角度进一步细化猪的攻击识别,因而提出一种基于位置敏感的TimeSformer的猪个体攻击行为识别算法。首先,采集猪栏中8头猪的3天视频,然后标记出600段1 s攻击视频段。从这些视频段中分割出每头猪的1144段攻击子视频和3328段非攻击子视频。为平衡正负样本个数,采用水平和垂直镜像将攻击子视频扩充至3432段,从而产生总共6760段子视频作为数据集。按照7:1:2比例将数据集划分为训练集、验证集和测试集。由于猪的攻击行为是连续的时空运动,因此采用TimeSformer网络提取猪的时空特征。然后,采用Transformer Encoder模块和FFN(feed forward net)网络重构特征。根据攻击猪具有连续交互的位置变化这一特点,将位置敏感融入TimeSformer网络以优化特征的区分度。最后,将重构后特征通过全连接层以识别猪的攻击行为。该方法的识别准确率为96.4%。结果表明,该方法能够有效识别猪个体的攻击行为。 展开更多
关键词 群养猪 攻击行为识别 深度学习 畜禽养殖 位置敏感
在线阅读 下载PDF
基于超图卷积和多角度拓扑细化的骨骼行为识别方法
11
作者 黄倩 苏新凯 +1 位作者 李畅 巫义锐 《计算机科学》 北大核心 2025年第5期220-226,共7页
由于人体骨架是一个天然存在的拓扑结构,因此图卷积网络(GCNs)被广泛地应用于基于骨骼的人体行为识别。然而,目前的基于GCN的方法只关注关节点对之间的低阶关系,而忽略了潜在的关节点在关节点群中的高阶关系。同时,现有的方法忽略了空... 由于人体骨架是一个天然存在的拓扑结构,因此图卷积网络(GCNs)被广泛地应用于基于骨骼的人体行为识别。然而,目前的基于GCN的方法只关注关节点对之间的低阶关系,而忽略了潜在的关节点在关节点群中的高阶关系。同时,现有的方法忽略了空间拓扑随时间的动态变化。这些不足影响了模型的表现。为此,利用K-NN计算出相关性高的关节点构成超边,提出了超图构建方法和超边图卷积来动态地学习关节点间的高阶关系。此外,设计了一个从时间和通道角度细化的拓扑图来学习帧级的和通道级的关节点对之间的相关性。最后,开发了一个多角度拓扑细化的超图卷积网络(HyperMTR-GCN)用于骨骼行为识别,其在NTU RGB+D和NTU RGB+D 120数据集上具有显著优势。具体地,所提方法在NTU RGB+D的X-sub基准上比2s-AGCN提高了3.7%,在NTU RGB+D 120的X-sub基准上比2s-AGCN提高了5.7%。 展开更多
关键词 行为识别 图卷积网络 超图神经网络 骨架建模 拓扑细化
在线阅读 下载PDF
基于知识蒸馏的考场异常行为识别
12
作者 姚捃 郭志林 《计算机应用与软件》 北大核心 2025年第3期156-161,共6页
在实际监控的边缘设备中使用GAN或者3DCNN等网络很难实现实时的、相对准确的监控任务。提出一种基于知识蒸馏的考场异常行为识别算法。相对于以提取空间、时序特征并进行融合为主流思想的异常行为识别,利用视频帧进行目标检测和知识蒸... 在实际监控的边缘设备中使用GAN或者3DCNN等网络很难实现实时的、相对准确的监控任务。提出一种基于知识蒸馏的考场异常行为识别算法。相对于以提取空间、时序特征并进行融合为主流思想的异常行为识别,利用视频帧进行目标检测和知识蒸馏的异常行为识别方法更加快速准确。算法借助知识蒸馏策略使用预训练的teacher网络监督student网络学习,进行正常行为的推理并检测异常行为。结果表明该算法达到了主流数据集的中上水平,并在考场环境具有良好的高效性与准确性。 展开更多
关键词 目标检测 注意力机制 知识蒸馏 异常行为识别
在线阅读 下载PDF
融合注意力机制的驾驶人行为识别模型研究
13
作者 徐慧智 张原铭 《重庆理工大学学报(自然科学)》 北大核心 2025年第10期1-12,共12页
选取辅助驾驶中驾驶人行为识别作为研究对象,设计基于融合时间和通道注意力机制的功能模块,构建驾驶人行为识别模型,提升识别准确率。探究多角度数据对模型性能提升情况,自建多视角驾驶人行为数据集,包括4种拍摄视角、10种驾驶行为、114... 选取辅助驾驶中驾驶人行为识别作为研究对象,设计基于融合时间和通道注意力机制的功能模块,构建驾驶人行为识别模型,提升识别准确率。探究多角度数据对模型性能提升情况,自建多视角驾驶人行为数据集,包括4种拍摄视角、10种驾驶行为、1148个视频数据。构建TCAM-R(2+1)D驾驶人行为识别模型,以(2+1)D卷积模块为基础,结合ResNET主干网络,提出融合时间和通道注意力机制的功能模块,增强模型提取时序信息的能力。使用Adabound优化器训练模型,提高模型的识别准确率和泛化能力。实验结果表明:通过增加模型的注意力机制,相较于R(2+1)D模型,自建数据集驾驶人行为识别准确率提高3.03%。采用大型人体运动数据集(HMBD51)进行消融实验,增加融合注意力机制功能模块准确率至59.60%(提高了1.93%),验证融合时间和通道注意力机制的增益效能。 展开更多
关键词 深度学习 行为识别 注意力机制 R(2+1)D模型
在线阅读 下载PDF
结合多视图学习的分心驾驶行为识别方法研究
14
作者 沈澍 刘秉松 +1 位作者 朱浩 黄苏岩 《小型微型计算机系统》 北大核心 2025年第7期1638-1644,共7页
随着科技发展,汽车驾驶引发的交通事故日益增长.其中驾驶员分心驾驶导致的事故最多.本文引入多视图学习与图卷积对分心驾驶行为识别的方法进行了深入研究.首先,本文构建了多视图分心驾驶行为数据集MDAD.然后,本文以View-GCN为模型基础架... 随着科技发展,汽车驾驶引发的交通事故日益增长.其中驾驶员分心驾驶导致的事故最多.本文引入多视图学习与图卷积对分心驾驶行为识别的方法进行了深入研究.首先,本文构建了多视图分心驾驶行为数据集MDAD.然后,本文以View-GCN为模型基础架构,基于任务需求与实际采集信息设计了各个视图的顶点空间坐标位置,并对基础架构中视角采样器与训练过程中损失函数的组合策略进行了调整,构建了多视图分心驾驶行为识别模型MVD-GCN,其准确率高达91.54%.经过各种对比实验,本文验证了MVD-GCN不仅在与传统单视图模型的对比中展现了明显的优势,而且在与本文中使用其他方法训练的多视图模型相比,也显示出了更高的分类性能. 展开更多
关键词 多视图学习 多视图分心驾驶行为数据集 图卷积 驾驶行为识别
在线阅读 下载PDF
基于CoordEF−YOLOv9t的煤矿井下人员行为识别
15
作者 潘红光 卫泽尘 +3 位作者 雷心宇 姚超修 蒋泽 张立斌 《工矿自动化》 北大核心 2025年第8期59-66,共8页
基于深度学习的人员行为识别方法在煤矿井下应用存在对多类别行为识别缺乏系统性分类架构、光线昏暗和低清晰度图像导致细节丢失、矿工姿态和视角差异引发特征形变等问题。提出一种煤矿井下人员行为识别模型CoordEF−YOLOv9t。该模型分... 基于深度学习的人员行为识别方法在煤矿井下应用存在对多类别行为识别缺乏系统性分类架构、光线昏暗和低清晰度图像导致细节丢失、矿工姿态和视角差异引发特征形变等问题。提出一种煤矿井下人员行为识别模型CoordEF−YOLOv9t。该模型分别从边缘细节与空间位置特征提取2个方面对YOLOv9t进行改进:YOLOv9t中RepNCSPELAN4模块的卷积操作在捕捉细微或模糊边缘时易导致细节模糊,针对该问题,设计了融合Sobel算子的边缘特征提取模块(EFEM),在RepNCSPELAN4模块中嵌入EFEM,增强主干网络与颈部网络对人体边缘细节的感知能力。传统卷积神经网络难以感知位置信息并充分学习人员位置与动作的空间特征,针对该问题,在颈部网络末端引入坐标卷积,提升模型对人员行为位置信息的感知能力。实验结果表明,CoordEF−YOLOv9t精确率P为73.4%,召回率R为73.7%,mAP@0.5为74.8%,mAP@0.5:0.95为61.1%,相较于YOLOv9t分别提升1.2%,3.2%,1.0%,2.1%;与RT−DETR,YOLOv11,YOLOv12等主流模型相比,CoordEF−YOLOv9t综合性能更优,能更精准地识别煤矿井下人员行为。 展开更多
关键词 井下人员行为识别 YOLOv9t 边缘特征提取 空间位置特征提取 SOBEL算子 坐标卷积
在线阅读 下载PDF
基于跨主体交互和多尺度时间增强的行为识别方法
16
作者 张君逸 赵培培 +3 位作者 梁松 杨迪 孙奥然 肖涛 《计算机应用研究》 北大核心 2025年第9期2847-2855,共9页
在图像/视频的行为识别算法中,存在骨骼图数据利用不充分、模型忽略运动中的交互语义信息,以及捕获运动中长短时信息不足等问题,导致在双人交互行为和相似动作场景下识别准确率不高。为解决这些问题,提出一种基于跨主体交互和多尺度时... 在图像/视频的行为识别算法中,存在骨骼图数据利用不充分、模型忽略运动中的交互语义信息,以及捕获运动中长短时信息不足等问题,导致在双人交互行为和相似动作场景下识别准确率不高。为解决这些问题,提出一种基于跨主体交互和多尺度时间增强的CTR-GCN(channel-wise topology refinement graph convolution net)网络的行为识别模型。针对输入骨骼图利用不充分的问题,将图数据进行分解来作数据增强,并设计集成网络来处理这些信息。现有算法主要学习单个主体的节点间的关系,忽略了双人交互行为时的交互语义信息的问题,设计了一种跨主体交互的Cformer(Cross-Transformer)深入学习主体间的交互特征。针对图卷积对时序信息中长短帧间信息处理不足的问题,提出了多尺度时间建模来增强模型对长短时特征的提取能力。实验结果表明,模型在NTU-RGBD和NTU-RGBD 120数据集上达到92.7%和89.4%的准确率,尤其在双人交互行为以及相似动作行为的场景下表现优异,验证了模型的有效性。 展开更多
关键词 行为识别 图卷积网络 CTR-GCN 双人交互行为识别 TRANSFORMER 注意力机制
在线阅读 下载PDF
基于时空双流特征增强网络的视频行为识别 被引量:2
17
作者 赵晨 冯秀芳 曹若琛 《计算机工程与设计》 北大核心 2025年第3期871-878,共8页
针对双流卷积网络中使用时间位移模块导致残差分支空间通道特征破坏和对全局时间特征提取不充分,以及使用帧差的特征微弱等问题,提出一种结合增强帧差信息的时空双流特征增强网络。该网络由空间流网络分支和时间流网络分支构成,空间流使... 针对双流卷积网络中使用时间位移模块导致残差分支空间通道特征破坏和对全局时间特征提取不充分,以及使用帧差的特征微弱等问题,提出一种结合增强帧差信息的时空双流特征增强网络。该网络由空间流网络分支和时间流网络分支构成,空间流使用ResNet50为骨干网络,构建空间增强时间位移模块和通道增强时间位移模块解决空间通道特征破坏问题,构建全局时空提取模块提取全局时空信息。时间流网络使用Inceptionv4作为骨干网络,提出运动增强模块解决帧差特征微弱问题。该模型在UCF101和HMDB51数据集上准确率达到96.6%和76.1%。与其它算法相比,识别精度较高,验证了该算法的有效性。 展开更多
关键词 双流网络 行为识别 深度学习 时间位移 帧差 空间特征 通道特征
在线阅读 下载PDF
基于YOLOv7模型的孕羊产前行为识别方法 被引量:1
18
作者 李少涵 袁洪波 +1 位作者 蔡振江 程曼 《河北农业大学学报》 北大核心 2025年第2期80-87,共8页
分娩对于母羊和羔羊来说都是一个关键时期,若在这一时期忽视母羊的接产和助产,可能会导致母羊难产、羔羊死亡等,这将直接影响到养殖场的经济效益。怀孕母羊的某些特定的生理表现或者行为变化可能是即将分娩的指示信号,在孕羊产前对此进... 分娩对于母羊和羔羊来说都是一个关键时期,若在这一时期忽视母羊的接产和助产,可能会导致母羊难产、羔羊死亡等,这将直接影响到养殖场的经济效益。怀孕母羊的某些特定的生理表现或者行为变化可能是即将分娩的指示信号,在孕羊产前对此进行检测有助于预测分娩行为的开始。本文提出了一种基于YOLOv7的深度学习网络对视频中孕羊的产前站立、普通躺卧、进食、饮水和分娩躺卧5种行为进行识别。试验结果表明该方法能够准确监测和识别出与分娩事件相关的个体孕羊行为,对于产前5种行为的识别精确度和召回率都在97%以上,全类别平均精度达到98.77%。 展开更多
关键词 孕羊 深度学习 目标检测 行为识别
在线阅读 下载PDF
基于骨骼图神经网络的人体行为识别综述 被引量:2
19
作者 蒋悦晗 陈俊杰 李洪均 《计算机工程与应用》 北大核心 2025年第3期34-47,共14页
基于骨骼图神经网络的人体行为识别凭借其简洁性和鲁棒性引起了人们的广泛关注,图数据对于处理人体骨骼信息有天然的优势,逐渐成为行为识别领域的研究热点。从行为识别这个宽泛的基本概念入手,进一步引入用骨骼图神经网络进行的人体行... 基于骨骼图神经网络的人体行为识别凭借其简洁性和鲁棒性引起了人们的广泛关注,图数据对于处理人体骨骼信息有天然的优势,逐渐成为行为识别领域的研究热点。从行为识别这个宽泛的基本概念入手,进一步引入用骨骼图神经网络进行的人体行为识别任务,分别从4个方面对近些年基于骨骼图神经网络的人体行为识别的研究成果进行了归纳总结;介绍了图结构构造拓扑图的不同方法分类、行为识别模型中的常用机制、目前常用的数据集及评价指标与目前主流方法的比较。最后,针对目前的研究状况对基于骨骼图神经网络的人体行为识别存在的问题进行详细的阐述,并立足于研究现状对该领域的未来发展进行了展望。 展开更多
关键词 行为识别 深度学习 图神经网络 注意力机制
在线阅读 下载PDF
基于运动特征增强双流网络的视频行为识别 被引量:1
20
作者 曹若琛 冯秀芳 赵晨 《科学技术与工程》 北大核心 2025年第4期1540-1546,共7页
为解决目前行为识别中双流网络对运动特征提取的不充分导致识别准确度低的问题,通过提出基于运动特征增强双流网络的行为识别方法提高准确率。该网络分为空间流和时间流,空间流网络和时间流网络结构相同,输入不同。空间流网络输入为视... 为解决目前行为识别中双流网络对运动特征提取的不充分导致识别准确度低的问题,通过提出基于运动特征增强双流网络的行为识别方法提高准确率。该网络分为空间流和时间流,空间流网络和时间流网络结构相同,输入不同。空间流网络输入为视频帧序列,而时间流网络输入为视频帧差序列。网络结构以Resnet50为骨干网络,将3×3卷积替换为所提出的全局运动特征模块和局部运动特征模块,充分提取视频运动信息,最终将空间流和时间流结合输出结果。结果表明:该模型在UCF101和HMDB51数据集上准确率达到96.8%和75.3%,与传统算法相比有一定优越性。 展开更多
关键词 行为识别 深度学习 运动特征 双流网络
在线阅读 下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部