期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于改进YOLOv8s的矿用输送带异物检测方法
1
作者 李润泽 郭星歌 +2 位作者 杨发展 赵培培 谢国龙 《工矿自动化》 北大核心 2025年第6期96-104,共9页
针对矿井低照度环境下输送带异物检测算法存在的图像全局特征提取不足、模型参数量过大等问题,提出一种基于改进YOLOv8s的矿用输送带异物检测方法。利用VMamba和MobileNetv4对YOLOv8s进行改进:采用MobileNetv4改进主干网络,集成通用逆瓶... 针对矿井低照度环境下输送带异物检测算法存在的图像全局特征提取不足、模型参数量过大等问题,提出一种基于改进YOLOv8s的矿用输送带异物检测方法。利用VMamba和MobileNetv4对YOLOv8s进行改进:采用MobileNetv4改进主干网络,集成通用逆瓶颈(UIB)模块,通过高效倒置残差结构降低模型整体参数量,通过动态特征适应机制增强小目标场景的特征鲁棒性;通过VMamba的视觉状态空间(VSS)模块改进核心特征提取与融合模块C2f,通过状态空间模型和四向扫描机制高效捕捉图像中的全局上下文信息,增强模型对图像全局结构的理解;设计了参数共享轻量化检测头,使用分组归一化(GN)作为归一化卷积基本块,弥补模型轻量化所带来的精度损失。实验结果表明:改进YOLOv8s模型在自建数据集上的mAP@0.5达0.921,mAP@0.5:0.95达0.601,参数量较YOLOv8s减少27.7%,性能优于主流目标检测模型YOLOv11s,YOLOv10s等,可以满足矿用输送带异物检测需求。 展开更多
关键词 输送带异物检测 YOLOv8s VMamba MobileNetv4 轻量化 分组归一化
在线阅读 下载PDF
基于特征增强与Transformer的煤矿输送带异物检测 被引量:7
2
作者 高涵 赵培培 +3 位作者 于正 肖涛 李肖利 李良先 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第7期199-208,共10页
输送带是煤矿井下最重要的运输设备之一,在输送工作中会因锚杆、槽钢、大块矸石等异物混入造成输送带撕裂、落煤口阻塞等重大安全事故,严重影响运输效率,甚至威胁工人生命安全。为了解决现有输送带异物检测算法存在的对细长物体表征能... 输送带是煤矿井下最重要的运输设备之一,在输送工作中会因锚杆、槽钢、大块矸石等异物混入造成输送带撕裂、落煤口阻塞等重大安全事故,严重影响运输效率,甚至威胁工人生命安全。为了解决现有输送带异物检测算法存在的对细长物体表征能力弱、弱语义特征提取能力差等问题,设计了一种基于低层级特征增强与Transformer机制的异物检测算法(Feature Enhancement and Transformer YOLO,FET–YOLO)。首先,针对现有检测网络难以提取细长物体特征的问题,引入可变形卷积以提升网络对细长异物的形状特性的适应性,并使用MobileViT模块增加图像中异物与背景的区分度,以提取出更符合细长异物的多样性特征,削弱背景噪声的干扰;其次,构建低层级特征增强模块(Low-Level Feature Enhancement Module,LFEM),提升异物弱语义特征在检测网络中的表达能力,以降低漏检、错检的概率;最后,引入鬼影混洗卷积(GSConv)减少因特征图尺寸变化造成的信息丢失,保证网络高效提取特征的同时,减少模型参数量。利用煤矿井下输送带工作视频制作训练集和验证集,并将提出的算法与现有的3种输送带检测算法对比,实验结果表明:所提出的算法可以更好的解决输送带异物目标检测中细长物体检测效果差、弱语义特征提取困难的问题,具有更高的检测精度、同时符合输送带检测场景对检测实时性的要求,对于分辨率大小为640×640的图像mAP@0.5可达0.875,mAP@0.5:0.95可达0.543,检测速度为75 fps。 展开更多
关键词 异物检测 YOLOv7-tiny 鬼影混洗卷积 输送带 深度学习
在线阅读 下载PDF
基于DRCA-GCN的矿工动作识别模型 被引量:2
3
作者 李善华 肖涛 +3 位作者 李肖利 杨发展 姚勇 赵培培 《工矿自动化》 CSCD 北大核心 2023年第4期99-105,112,共8页
井下“三违”行为给煤矿生产带来严重安全隐患,提前感知并预防井下工作人员的不安全动作具有重要意义。针对因煤矿监控视频质量不佳导致基于图像的动作识别方法准确率受限的问题,构建了基于密集残差和组合注意力的图卷积网络(DRCA-GCN)... 井下“三违”行为给煤矿生产带来严重安全隐患,提前感知并预防井下工作人员的不安全动作具有重要意义。针对因煤矿监控视频质量不佳导致基于图像的动作识别方法准确率受限的问题,构建了基于密集残差和组合注意力的图卷积网络(DRCA-GCN),提出了基于DRCA-GCN的矿工动作识别模型。首先利用人体姿态识别模型OpenPose提取人体关键点,并对缺失关键点进行补偿,以降低因视频质量不佳造成关键点缺失的影响,然后利用DRCA-GCN识别矿工动作。DRCA-GCN在时空初始图卷积网络(STIGCN)基础上引入组合注意力机制和密集残差网络:通过组合注意力机制提升模型中每个网络层对重要时间序列、空间关键点和通道特征的提取能力;通过密集残差网络对提取的动作特征进行信息补偿,加强各网络间的特征传递,进一步提升模型对矿工动作特征的识别能力。实验结果表明:(1)在公共数据集NTU-RGB+D120上,以Cross-Subject(X-Sub)和CrossSetup(X-Set)作为评估协议时,DRCA-GCN的识别精度分别为83.0%和85.1%,相比于STIGCN均提高了1.1%,且高于其他主流动作识别模型;通过消融实验验证了组合注意力机制和密集残差网络的有效性。(2)在自建矿井人员动作(MPA)数据集上,进行缺失关键点补偿后,DRCA-GCN对下蹲、站立、跨越、横躺和坐5种动作的平均识别准确率由94.2%提升到96.7%;DRCA-GCN对每种动作的识别准确率均在94.2%以上,与STIGCN相比,平均识别准确率提升了6.5%,且对相似动作不易误识别。 展开更多
关键词 矿工动作识别 不安全动作识别 图卷积网络 组合注意力机制 密集残差网络 人体姿态提取 缺失关键点补偿
在线阅读 下载PDF
基于跨主体交互和多尺度时间增强的行为识别方法
4
作者 张君逸 赵培培 +3 位作者 梁松 杨迪 孙奥然 肖涛 《计算机应用研究》 2025年第9期2847-2855,共9页
在图像/视频的行为识别算法中,存在骨骼图数据利用不充分、模型忽略运动中的交互语义信息,以及捕获运动中长短时信息不足等问题,导致在双人交互行为和相似动作场景下识别准确率不高。为解决这些问题,提出一种基于跨主体交互和多尺度时... 在图像/视频的行为识别算法中,存在骨骼图数据利用不充分、模型忽略运动中的交互语义信息,以及捕获运动中长短时信息不足等问题,导致在双人交互行为和相似动作场景下识别准确率不高。为解决这些问题,提出一种基于跨主体交互和多尺度时间增强的CTR-GCN(channel-wise topology refinement graph convolution net)网络的行为识别模型。针对输入骨骼图利用不充分的问题,将图数据进行分解来作数据增强,并设计集成网络来处理这些信息。现有算法主要学习单个主体的节点间的关系,忽略了双人交互行为时的交互语义信息的问题,设计了一种跨主体交互的Cformer(Cross-Transformer)深入学习主体间的交互特征。针对图卷积对时序信息中长短帧间信息处理不足的问题,提出了多尺度时间建模来增强模型对长短时特征的提取能力。实验结果表明,模型在NTU-RGBD和NTU-RGBD 120数据集上达到92.7%和89.4%的准确率,尤其在双人交互行为以及相似动作行为的场景下表现优异,验证了模型的有效性。 展开更多
关键词 行为识别 图卷积网络 CTR-GCN 双人交互行为识别 Transformer 注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部