期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
融合关键区域信息的双流网络视频表情识别
1
作者 孔英会 崔文婷 +1 位作者 张珂 车辚辚 《智能系统学报》 北大核心 2025年第3期658-669,共12页
人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息... 人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息的双流网络表情识别方法。构建空间-时间双流网络,其中空间网络分支结合面部运动单元和CSFA(channel-spatial frame attention),重点关注影响表情识别结果的面部关键区域,以实现空间特征的有效提取;时间分支通过Farneback提取光流获得帧间的表情运动信息,并借助空间关键区域掩模选取降低光流计算复杂度。对空间-时间双流网络识别结果进行决策融合,得到最终视频表情识别结果。该方法在eNTERFACE'05、CK+数据集上进行实验测试,结果表明本文所提方法可有效提升识别精度,且提高了运行效率。 展开更多
关键词 视频表情识别 双流网络 注意力机制 光流 卷积神经网络 掩模 特征融合 面部表情识别
在线阅读 下载PDF
双流运动建模-循环一致性对齐小样本动作识别算法
2
作者 胡正平 董佳伟 王昕宇 《燕山大学学报》 北大核心 2025年第1期83-94,共12页
针对不同场景下动作时空分布不同导致视频对齐困难,进而影响视频识别准确度问题,提出对双流特征进行运动建模和循环一致性对齐的小样本动作识别方法,能够在全局帧和局部块双尺度特征建模和对齐高维运动表示。首先基于双流特征设计了运... 针对不同场景下动作时空分布不同导致视频对齐困难,进而影响视频识别准确度问题,提出对双流特征进行运动建模和循环一致性对齐的小样本动作识别方法,能够在全局帧和局部块双尺度特征建模和对齐高维运动表示。首先基于双流特征设计了运动建模框架,重塑视频序列中动作表示的时空联系,实现对视频动作的准确定位和语义性捕获;然后,为帮助模型学习动作间时空对应关系,引入循环一致性对齐机制,利用软最近邻查询的方法,高效对齐视频动作,显著改善了视频动作的错位问题;最后,结合基于注意力机制的时域交叉匹配模块,对动作类别进行推理分类。实验结果表明,该算法在SSv2、HMDB51、UCF101上分别达到68.6%、77.7%和96.9%的识别精度,实现了对视频动作的有效识别。 展开更多
关键词 小样本学习 动作识别 双流网络 注意力机制 循环一致性对齐
在线阅读 下载PDF
基于CNN-Transformer的电子喉镜病灶及器官分割网络
3
作者 李白芽 《计算机工程》 北大核心 2025年第6期327-337,共11页
在电子喉镜检查中,随着镜头的移动,病灶和器官的形态会发生多种变化,同时病灶和器官与黏膜组织的边界不清晰,导致了对病灶和主要喉部器官进行同步图像分割的准确率不理想。为解决这一问题,提出一种CNN-Transformer双流混合网络。双流混... 在电子喉镜检查中,随着镜头的移动,病灶和器官的形态会发生多种变化,同时病灶和器官与黏膜组织的边界不清晰,导致了对病灶和主要喉部器官进行同步图像分割的准确率不理想。为解决这一问题,提出一种CNN-Transformer双流混合网络。双流混合网络中的卷积神经网络(CNN)分支负责提取细粒度特征,而Transformer分支则负责提取全局语义特征。具体来说,混合网络通过CNN对图像中多种尺度下的细粒度特征进行挖掘,然后将提取到的不同尺度下的CNN特征与Transformer分支提取到的相应尺度下的全局语义特征进行融合。这种双流混合结构既能有效实现捕获到特征的浅层次及局部细节信息表现,同时又能对深层特征和全局信息保持敏感。此外,在进行多层次特征融合前,使用暗部特征强化模块来增强阴影区域图像的特征细节,以保证分割的准确率。为验证方法的有效性,使用了来自不同医疗机构的2425张喉镜手术图像进行实验,并与近期提出的9种方法进行了对比分析,实验结果证明了所提出方法的先进性。 展开更多
关键词 电子喉镜 图像分割 双流混合网络 多尺度特征融合 暗部特征增强
在线阅读 下载PDF
融合局部感知增强的投篮上肢动作分解与高精度识别算法
4
作者 任宇飞 刘海林 《现代电子技术》 北大核心 2025年第18期119-124,共6页
为解决传统动作识别算法在处理篮球训练图像时存在的关节遮挡、感受野过大等问题,提出一种融合局部感知增强的高精度上肢动作分解识别模型。该模型通过轻量级HRNet分支提取人体全局结构特征,结合双流金字塔模块增强局部关节感知能力。... 为解决传统动作识别算法在处理篮球训练图像时存在的关节遮挡、感受野过大等问题,提出一种融合局部感知增强的高精度上肢动作分解识别模型。该模型通过轻量级HRNet分支提取人体全局结构特征,结合双流金字塔模块增强局部关节感知能力。空间流采用空洞卷积扩大手部感受野,时间流利用光流捕捉球员上肢的相对运动情况,显著提升了遮挡场景下的手部定位精度。同时,模型中还设计了时空分解模块进行空间与时序特征分析,强制网络聚焦并学习帧间的运动一致性,使数据处理的过程更具鲁棒性。最后引入自适应加权单元,最终输出高精度的关节点坐标。实验测试结果表明:所提模型的mAP@0.5达到86.9%,动作分类的F1值为95.3%,均优于目前的主流算法;且关键帧检出率为91.1%,帧率达到47 f/s,实时性良好,充分证明了该模型能够为篮球训练与赛事智能化分析提供可靠的技术手段。 展开更多
关键词 HRNet模型 双流金字塔 图卷积网络 时间卷积网络 人体动作识别 图像分析
在线阅读 下载PDF
基于时空双流特征增强网络的视频行为识别 被引量:2
5
作者 赵晨 冯秀芳 曹若琛 《计算机工程与设计》 北大核心 2025年第3期871-878,共8页
针对双流卷积网络中使用时间位移模块导致残差分支空间通道特征破坏和对全局时间特征提取不充分,以及使用帧差的特征微弱等问题,提出一种结合增强帧差信息的时空双流特征增强网络。该网络由空间流网络分支和时间流网络分支构成,空间流使... 针对双流卷积网络中使用时间位移模块导致残差分支空间通道特征破坏和对全局时间特征提取不充分,以及使用帧差的特征微弱等问题,提出一种结合增强帧差信息的时空双流特征增强网络。该网络由空间流网络分支和时间流网络分支构成,空间流使用ResNet50为骨干网络,构建空间增强时间位移模块和通道增强时间位移模块解决空间通道特征破坏问题,构建全局时空提取模块提取全局时空信息。时间流网络使用Inceptionv4作为骨干网络,提出运动增强模块解决帧差特征微弱问题。该模型在UCF101和HMDB51数据集上准确率达到96.6%和76.1%。与其它算法相比,识别精度较高,验证了该算法的有效性。 展开更多
关键词 双流网络 行为识别 深度学习 时间位移 帧差 空间特征 通道特征
在线阅读 下载PDF
基于运动特征增强双流网络的视频行为识别 被引量:1
6
作者 曹若琛 冯秀芳 赵晨 《科学技术与工程》 北大核心 2025年第4期1540-1546,共7页
为解决目前行为识别中双流网络对运动特征提取的不充分导致识别准确度低的问题,通过提出基于运动特征增强双流网络的行为识别方法提高准确率。该网络分为空间流和时间流,空间流网络和时间流网络结构相同,输入不同。空间流网络输入为视... 为解决目前行为识别中双流网络对运动特征提取的不充分导致识别准确度低的问题,通过提出基于运动特征增强双流网络的行为识别方法提高准确率。该网络分为空间流和时间流,空间流网络和时间流网络结构相同,输入不同。空间流网络输入为视频帧序列,而时间流网络输入为视频帧差序列。网络结构以Resnet50为骨干网络,将3×3卷积替换为所提出的全局运动特征模块和局部运动特征模块,充分提取视频运动信息,最终将空间流和时间流结合输出结果。结果表明:该模型在UCF101和HMDB51数据集上准确率达到96.8%和75.3%,与传统算法相比有一定优越性。 展开更多
关键词 行为识别 深度学习 运动特征 双流网络
在线阅读 下载PDF
基于注意力机制和跨模态层级特征融合的群养肉牛个体质量估测
7
作者 宋平 杨颖 +3 位作者 刘刚 姚冲 李子若 毛天赐 《农业工程学报》 北大核心 2025年第10期221-231,共11页
为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-g... 为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-green-blue)图像与深度图像,使用引入定向边界框OBB(oriented bounding box)的YOLOv8网络对肉牛进行旋转目标检测和识别,精准定位群养场景中的个体目标;其次,以ResNet50为骨干网络构建双流估重模型,分别提取RGB和深度模态特征,并引入CBAM(convolutional block attention module)注意力机制以增强关键特征表达能力。设计跨模态的层级特征融合,有效结合RGB流和深度流的特征并充分利用浅层特征;第三,引入肉牛的身份信息便于网络学习肉牛身份与其体质量之间的对应关系,为优化模型效率,将全连接层替换为KAN(kolmogorov-arnold networks),显著减少参数量;最后,将双流的输出结果融合,回归肉牛体质量值。在试验中,构建了包含2546对RGB-D图像的数据集,包括2373对训练数据和173对验证数据。结果表明,CMHFF-ResNet在验证集上的平均绝对误差为14.19 kg。与基于RGB和深度的单流模型相比,双流模型在平均绝对误差上分别降低16.943%和26.133%。同时,该方法优于其他现有肉牛体质量估测方法:与多元线性回归、改进MobileNetv2模型、改进DenseNet201模型和改进跨模态特征融合模型CFF-ResNet相比,在平均绝对误差上分别减少57.233%、34.699%、24.761%和20.991%,提升了群养环境下肉牛个体质量估测的精度与泛化性,能够有效地学习跨模态的层级特征表示。该研究为大规模群养环境中肉牛个体质量的高精度估测提供了参考。 展开更多
关键词 模型 计算机视觉 目标检测 体质量估测 注意力机制 跨模态层级特征融合 双流网络
在线阅读 下载PDF
基于改进双流网络的光伏漏电故障检测算法 被引量:2
8
作者 谢小诚 杨文呈 +3 位作者 赵彦宏 丁毅 李王宏 杨晨 《电网与清洁能源》 北大核心 2025年第1期146-154,共9页
针对含光伏电源的低压配电台区中剩余电流受多种因素影响,使正常泄漏电流波动,造成漏电流故障难以被准确识别的问题,提出基于改进双流神经网络的含光伏电源的低压配电台区漏电故障检测算法。首先,通过改进的卷积神经网络结构提取漏电故... 针对含光伏电源的低压配电台区中剩余电流受多种因素影响,使正常泄漏电流波动,造成漏电流故障难以被准确识别的问题,提出基于改进双流神经网络的含光伏电源的低压配电台区漏电故障检测算法。首先,通过改进的卷积神经网络结构提取漏电故障波形的空间特征;然后,基于长短期记忆神经网络提取漏电故障波形的时序特征,通过CBAM(convolutional block attention module,CBAM)注意力机制从空间角度提取关键信息,并增强每个通道的特征表达以提取重要特性,从而实现漏电故障精确识别;最后,通过仿真模型进行仿真分析与验证。实验结果表明,该文提出方法可实现漏电故障的高精度检测,且与常用方法相比,所提方法的故障检测准确率和稳定性更高、抗干扰能力更强。 展开更多
关键词 双流神经网络 注意力机制 漏电故障 剩余电流 光伏电源
在线阅读 下载PDF
基于参数高效微调及双流网络的人脸伪造检测
9
作者 陈咏豪 蔡满春 +3 位作者 张溢文 彭舒凡 姚利峰 朱懿 《计算机工程与应用》 北大核心 2025年第10期288-298,共11页
随着深度伪造技术的发展,伪造的人脸图像愈发逼真,深度伪造技术一旦被不法分子滥用将对社会治安和公共安全造成危害,因此如何对深度伪造进行有效检测成为重要的研究课题。现有的深度伪造检测技术普遍存在跨库检测泛化性差、跨压缩率检... 随着深度伪造技术的发展,伪造的人脸图像愈发逼真,深度伪造技术一旦被不法分子滥用将对社会治安和公共安全造成危害,因此如何对深度伪造进行有效检测成为重要的研究课题。现有的深度伪造检测技术普遍存在跨库检测泛化性差、跨压缩率检测鲁棒性差的问题。为解决上述问题,提出了一种基于参数高效微调及双流网络的人脸伪造检测。利用MIM(masked image modeling)自监督方法预训练的ViT作为分支主干,并引入低秩适应(lowrank adaptation,LoRA)进行微调,以保留预训练模型的先验知识并提高在深度伪造检测任务中的适应能力;设计了一种跨域双向适配器BCA(bi-directional cross-modal adapter)和跨域交叉注意力适配器DCA(dual-modal crossattention adapter)用于对两条分支进行微调及信息互补。在双流网络尾部加入多层感知机适配器以完成分类。实验结果表明,在训练参数为3.75×10^(7)的情况下,该方法在六个主流数据集上的平均AUC达到了99.67%,在跨库泛化性实验中平均AUC达到了77.3%,在跨压缩率实验中平均AUC达到了89.5%。 展开更多
关键词 深度伪造检测 双流网络 高效参数微调 高频噪声 自监督预训练
在线阅读 下载PDF
基于段帧特征图的双流CNN噪声识别模型
10
作者 李春腾 黄智 +2 位作者 李诠娜 魏海礁 徐松岩 《海军工程大学学报》 北大核心 2025年第5期44-49,72,共7页
鉴于噪声抑制算法对不同类型激励源生成的运动感应噪声处理效果不同,为进一步提高算法对运动感应噪声的适配性,提出了一种基于段帧特征图的双流卷积神经网络噪声识别模型。首先,通过设计能够描述运动感应噪声特征的段帧特征图,为噪声识... 鉴于噪声抑制算法对不同类型激励源生成的运动感应噪声处理效果不同,为进一步提高算法对运动感应噪声的适配性,提出了一种基于段帧特征图的双流卷积神经网络噪声识别模型。首先,通过设计能够描述运动感应噪声特征的段帧特征图,为噪声识别模型提供有效的全局特征和细节特征,并构造了一种双流卷积神经网络以充分提取段帧特征图提供的噪声特征;然后,在实验室环境下搭建噪声识别模型性能测试平台,结合Quick Sounds数据库引入复杂水下激励源类型,设置了多组对照实验。结果表明:段帧特征图可以有效表征运动感应噪声类型,能够弥补神经网络识别能力的不足,从而使所提噪声识别模型展现出良好的性能。 展开更多
关键词 运动感应噪声 段特征图 帧特征图 双流卷积神经网络
在线阅读 下载PDF
考虑流量水平的网络视频平台双边定价及广告商投放决策
11
作者 李薇 李相勇 +1 位作者 李鑫 杨瑞光 《系统管理学报》 北大核心 2025年第3期605-619,共15页
作为一种新兴双边平台,网络视频平台连接消费者和广告商实现盈利,其收入来源于向广告商支付的广告费及消费者订阅的会员费。研究构建了考虑网络视频平台典型特征的博弈模型,分析了消费者流量水平、广告厌恶度及网络外部性等因素对平台... 作为一种新兴双边平台,网络视频平台连接消费者和广告商实现盈利,其收入来源于向广告商支付的广告费及消费者订阅的会员费。研究构建了考虑网络视频平台典型特征的博弈模型,分析了消费者流量水平、广告厌恶度及网络外部性等因素对平台服务模式选择(免费模式或混合模式)、双边定价(广告费与会员费)以及广告商广告投放决策的影响。结果表明:存在一个成本阈值,当高广告厌恶度消费者的广告接受成本大于该阈值时,平台选择混合模式,反之则选择免费模式;该阈值受高广告厌恶度消费者比例、流量水平上限及广告商网络外部性强度共同影响。在两种服务模式下,消费者流量水平上限对平台广告费率均具有正效应;而在混合模式下,消费者流量水平上限对平台会员费率具有负效应。消费者流量水平上限对广告商最优广告投放量具有正效应,但在不同服务模式下影响幅度不同。广告商网络外部性对广告商最优广告投放量和平台广告费率均具有正效应,且其对免费模式下最优广告投放量的影响大于混合模式。在混合模式下,消费者网络外部性对平台会员费率具有负效应。 展开更多
关键词 网络视频平台 流量水平 网络外部性 双边定价 广告投放
在线阅读 下载PDF
基于双流特征融合的配电房异常入侵检测研究
12
作者 郑洋斌 侯北平 +1 位作者 邵方坤 曹志文 《现代电子技术》 北大核心 2025年第19期84-91,共8页
针对常规入侵检测方法在配电站房的应用中由于视角变化、运动模糊、遮挡等导致的漏检和误检问题,文中提出一种双流二阶段融合的异常入侵检测方法。该方法构建了轻量级的双流网络通道用于表征图像和光流图像的特征提取;采用的双流二阶段... 针对常规入侵检测方法在配电站房的应用中由于视角变化、运动模糊、遮挡等导致的漏检和误检问题,文中提出一种双流二阶段融合的异常入侵检测方法。该方法构建了轻量级的双流网络通道用于表征图像和光流图像的特征提取;采用的双流二阶段融合策略实现了两种特征的有效融合。在监控数据集上进行了实验验证并应用于配电站房的场景检测中,检测精度优于YOLOv8n基准模型。实验结果表明,该模型具有较高的泛化能力,能够减少数据的重复采集与标注,并能优化模型训练与部署,具有实际应用价值。 展开更多
关键词 配电站房视频分析 目标检测 注意力机制 双流网络 自适应权重 复杂场景 YOLOv8n CBAM
在线阅读 下载PDF
频域辅助监督双流网络的人脸呈现攻击检测
13
作者 封筠 李景涛 +1 位作者 贺晶晶 高宇豪 《燕山大学学报》 北大核心 2025年第4期339-348,共10页
人脸呈现攻击检测对于保障人脸识别系统安全至关重要。针对仅有可见光模态的数据受限场景,因提取的图像特征对光照敏感而导致模型泛化能力较差的问题,提出一种基于多级频域辅助监督的双流人脸呈现攻击检测方法,采用低频、中频和高频分... 人脸呈现攻击检测对于保障人脸识别系统安全至关重要。针对仅有可见光模态的数据受限场景,因提取的图像特征对光照敏感而导致模型泛化能力较差的问题,提出一种基于多级频域辅助监督的双流人脸呈现攻击检测方法,采用低频、中频和高频分量的多级特征融合策略,以充分利用不同频段的信息。为确保高频信息的有效传递和利用,提出频域级残差融合注意力模块,由分层交叉注意力驱动的二进制监督流与像素级监督流进行协作学习。在4个公开数据集上的实验结果表明,所提方法在跨数据集交叉测试中平均HTER和AUC值分别达到14.01%、92.50%,相较于7种现有文献方法获得最佳的域泛化性能,在学习具有分布差异数据的泛化特征方面具有优势。 展开更多
关键词 人脸呈现攻击检测 频域信息 双流网络 特征融合
在线阅读 下载PDF
面向复杂环境的人机协作装配意图识别方法
14
作者 何家威 张朝阳 +2 位作者 叶子健 史天佑 郑坤明 《西安交通大学学报》 北大核心 2025年第12期44-57,共14页
针对复杂环境中人机协作装配系统存在的识别装配动作准确率较低、动作相似度高时无法准确感知装配者意图,以及由此导致的机器人配合操作者的装配效率较低的问题,从装配动作信息和装配零件信息之间的联系出发,建立了面向复杂环境的人机... 针对复杂环境中人机协作装配系统存在的识别装配动作准确率较低、动作相似度高时无法准确感知装配者意图,以及由此导致的机器人配合操作者的装配效率较低的问题,从装配动作信息和装配零件信息之间的联系出发,建立了面向复杂环境的人机协作装配意图识别融合模型。基于骨架特征,采用双流自适应图卷积神经网络(2S-AGCN)模型针对装配进行动作识别;提出改进的YOLOV8模型,以提高装配零件在无序和遮挡环境下的识别准确率;结合当前装配任务,设计了包含装配动作和装配零件信息的装配推理规则,规划装配顺序。在装配动作数据集以及装配泵体零件数据集上对所提方法进行了验证。实验结果表明:交并比为0.50~0.95时,YOLOV8模型对零件识别的平均准确率达到88.361%;所提出的融合模型对于操作者装配意图的识别准确率达到96.66%,验证了人机协作系统识别操作者装配意图的可行性和有效性。将装配动作信息与装配零件信息相结合,有助于在复杂的人机协作环境中准确地识别出操作者的装配意图。 展开更多
关键词 人机协作 动作识别 双流自适应图卷积神经网络 YOLOV8模型 意图识别融合模型
在线阅读 下载PDF
基于特征融合时序分割网络的行为识别研究 被引量:17
15
作者 李洪均 丁宇鹏 +1 位作者 李超波 张士兵 《计算机研究与发展》 EI CSCD 北大核心 2020年第1期145-158,共14页
行为识别是当今计算机视觉领域的一个研究热点,是一项具有挑战性的任务.行为识别分析与其网络输入数据类型、网络结构、特征融合环节具有密切联系.目前,主流的行为识别网络输入数据为RGB图像和光流图像,网络结构主要以双流和3D卷积为主... 行为识别是当今计算机视觉领域的一个研究热点,是一项具有挑战性的任务.行为识别分析与其网络输入数据类型、网络结构、特征融合环节具有密切联系.目前,主流的行为识别网络输入数据为RGB图像和光流图像,网络结构主要以双流和3D卷积为主;而特征选择直接影响到识别的效率,多层次的特征融合工作还有很多问题有待解决.针对主流的双流卷积网络输入数据为RGB图像和光流图像的局限,利用低秩空间中稀疏特征能够有效捕捉视频中运动物体信息的特点,对网络输入数据进行补充.同时,针对网络中缺乏信息交互的特点,将深度网络中高层语义信息和低层细节信息结合起来共同识别行为动作,使时序分割网络性能更具优势.在行为识别数据集UCF101和HMDB51上取得了97.1%和76.7%的识别效果,较目前主流算法有了较大的提升.实验结果表明,该方法能够有效地提高行为识别的识别率. 展开更多
关键词 行为识别 稀疏特征 时序分割网络 双流卷积网络 特征融合
在线阅读 下载PDF
基于改进双流算法的矿工行为识别方法研究 被引量:5
16
作者 陈天 闫雨寒 +2 位作者 徐达伟 刘忠育 丁恩杰 《河南科技大学学报(自然科学版)》 CAS 北大核心 2021年第4期47-53,M0005,共8页
针对目前矿工行为数据集构建不全面、行为识别实时性较差、对相似行为的细粒性识别精度较低等问题,提出了一种端到端的自主学习行为特征并实现行为分类的识别方法。首先,对原始矿工行为视频进行特征提取,生成用来描述时间特征的光流图... 针对目前矿工行为数据集构建不全面、行为识别实时性较差、对相似行为的细粒性识别精度较低等问题,提出了一种端到端的自主学习行为特征并实现行为分类的识别方法。首先,对原始矿工行为视频进行特征提取,生成用来描述时间特征的光流图以及可以描述空间特征的三原色(RGB)图像,使用双流网络对提取的特征进行学习并得到行为分类结果;然后,引入量子遗传算法对双流网络进行改进,对网络中待训练参数进行量子编码,将双流网络在测试集上的代价函数值作为适应度函数。采用量子交叉、量子门旋转实现种群个体的进化。构建了包含50种矿工行为的数据集,在该数据集上利用双流法进行行为识别。研究结果表明:使用量子遗传算法优化后的3种双流网络的识别准确率,比优化前分别提升了1.01%,0.87%和0.32%。通过与其他矿工行为识别算法进行对比,本文所提方法在两种数据集上识别率分别达到90.36%和72.29%,均优于其他几种识别算法,准确率最大差距达到22.36%,证明了本文所提方法的有效性。 展开更多
关键词 矿工行为识别 双流网络 量子遗传 光流法 深度学习
在线阅读 下载PDF
应用区域关联自适应图卷积的动作识别方法 被引量:6
17
作者 马利 郑诗雨 牛斌 《计算机科学与探索》 CSCD 北大核心 2022年第4期898-908,共11页
基于骨架数据的动作识别方法由于其对动态环境和复杂背景的强适应性而受到广泛的关注和研究,应用图卷积网络描述人体骨架实现人体动作识别可以取得很好的识别效果,但实现过程中图的拓扑结构通常是手动设置的,且在所有层和输入样本上的... 基于骨架数据的动作识别方法由于其对动态环境和复杂背景的强适应性而受到广泛的关注和研究,应用图卷积网络描述人体骨架实现人体动作识别可以取得很好的识别效果,但实现过程中图的拓扑结构通常是手动设置的,且在所有层和输入样本上的结构固定,只能捕获关节之间的局部物理关系,会遗漏非物理连接的关节相关性。提出了一种新的基于区域关联自适应图卷积网络的骨架动作识别,通过自适应图卷积使参数化的全局图和单个数据图的结构与模型卷积参数在不同的层中分别进行训练和更新,增加了模型中图形构造的灵活性与模型对于各种数据样本的通用性。同时引入区域关联图卷积,通过在关节特征与连接特征之间交替信息传递来捕获数据帧间各关节的非物理连接相关性。并加入骨骼的二阶数据对原有关节数据进行信息补充,融合两者构成双流网络提升识别网络的性能。在NTU-RGBD大规模数据集上的实验表明,该模型在动作识别的准确率上有了一定的提升。 展开更多
关键词 自适应 区域关联 双流网络 图卷积
在线阅读 下载PDF
基于深度学习的人体行为识别综述 被引量:26
18
作者 邓淼磊 高振东 +1 位作者 李磊 陈斯 《计算机工程与应用》 CSCD 北大核心 2022年第13期14-26,共13页
人体行为识别旨在对视频监控中的人体行为进行检索并识别,是人工智能领域的研究热点。基于传统方法的人体行为识别算法存在对样本数据依赖大、易受环境噪声影响等不足。为解决此问题,许多适用于不同应用场景的基于深度学习的人体行为识... 人体行为识别旨在对视频监控中的人体行为进行检索并识别,是人工智能领域的研究热点。基于传统方法的人体行为识别算法存在对样本数据依赖大、易受环境噪声影响等不足。为解决此问题,许多适用于不同应用场景的基于深度学习的人体行为识别算法被提出。介绍了人体行为识别任务中传统特征提取方法和基于深度学习的特征提取方法;从性能和应用两方面对基于深度学习的人体行为识别算法进行总结,重点分析了基于3D卷积神经网络、混合网络、双流卷积神经网络和少样本学习(few-shotlearning,FSL)的人体行为识别方法及其在UCF101和HMDB51数据集上的表现;在深度学习的基础上,归纳了主流模型迁移方法的优缺点及其有效性;总结了现有基于深度学习的人体行为识别算法存在的不足,并讨论了以元学习(meta-learning)和transformer为代表的FSL算法将成为未来模型主流算法的可能性,同时对未来基于深度学习的人体行为识别算法的发展方向进行展望。 展开更多
关键词 行为识别 深度学习 双流卷积网络 少样本学习 元学习
在线阅读 下载PDF
基于拉格朗日场的多级运动特征暴力行为识别 被引量:2
19
作者 娄久 左德承 +1 位作者 张展 刘宏伟 《信号处理》 CSCD 北大核心 2022年第7期1497-1506,共10页
针对暴力行为识别过程中缺乏描述不同时间尺度下暴力行为运动变化的问题,本文提出了一种基于拉格朗日场的多级运动特征暴力行为识别算法。该算法将描述非线性粒子运动的拉格朗日场引入暴力行为分析过程中,首先通过构建基于光流的拉格朗... 针对暴力行为识别过程中缺乏描述不同时间尺度下暴力行为运动变化的问题,本文提出了一种基于拉格朗日场的多级运动特征暴力行为识别算法。该算法将描述非线性粒子运动的拉格朗日场引入暴力行为分析过程中,首先通过构建基于光流的拉格朗日场来挖掘不同时间尺度下暴力行为运动特征,设计了基于拉格朗日场的多级运动模块,该模块可以根据输入光流序列长度,计算多级运动特征;然后构建了基于流量门控制机制的双流网络,将多级运动特征和RGB图像特征融合;最后,利用LSTM和全连接模型计算识别结果。实验证明,该方法在公共暴力识别数据集上取得了很好的效果,特别是在真实监控场景的RWF-2000数据集上,暴力行为识别正确识别率可以达到88.4%,优于其他算法。 展开更多
关键词 暴力行为识别 多级运动特征 双流网 拉格朗日场 光流
在线阅读 下载PDF
基于改进空时双流网络的红外行人动作识别研究 被引量:4
20
作者 蒋一 侯丽萍 张强 《红外技术》 CSCD 北大核心 2021年第9期852-860,共9页
为了提升复杂背景下红外序列的行人动作识别精度,本文提出了一种改进的空时双流网络,该网络首先采用深度差分网络代替时间信息网络,提高时空特征的表征能力与提取效率;然后,采用基于决策级特征融合机制的代价函数对模型进行训练,可以更... 为了提升复杂背景下红外序列的行人动作识别精度,本文提出了一种改进的空时双流网络,该网络首先采用深度差分网络代替时间信息网络,提高时空特征的表征能力与提取效率;然后,采用基于决策级特征融合机制的代价函数对模型进行训练,可以更大限度地保留不同网络帧间图像的时空特征,更加真实地反映行人的动作类别。仿真结果表明,本文提出的改进网络在自建的红外视频数据集上获得了81%的识别精度,且计算效率也提升了25%,具有较高的工程应用价值。 展开更多
关键词 双流网络 红外序列 动作识别 光流图像 差分网络 深度学习 空时特征
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部