期刊文献+
共找到65篇文章
< 1 2 4 >
每页显示 20 50 100
HD-YOLO:复杂场景下安全帽佩戴检测算法 被引量:2
1
作者 邱云飞 腰瑞琳 +1 位作者 金海波 张嘉宁 《安全与环境学报》 北大核心 2025年第1期165-174,共10页
针对目标密集、有遮挡的复杂施工场景下安全帽佩戴检测存在漏检、误检的问题,提出了一种基于YOLOv8的HD-YOLO安全帽佩戴检测算法。首先,设计了GRC-C2f结构,使用多分支结构捕获多尺度特征,兼顾训练阶段的特征提取能力和推理阶段的计算效... 针对目标密集、有遮挡的复杂施工场景下安全帽佩戴检测存在漏检、误检的问题,提出了一种基于YOLOv8的HD-YOLO安全帽佩戴检测算法。首先,设计了GRC-C2f结构,使用多分支结构捕获多尺度特征,兼顾训练阶段的特征提取能力和推理阶段的计算效率。其次,设计了DSASF颈部结构,结合动态上采样和多尺度特征融合,精准识别和定位图像中的小目标,以提高检测性能。然后,引入Focal Modulation模块替换原有的快速空间金字塔池化(Spatial Pyramid Pooling-Fast,SPPF)结构模块,捕捉图像中的长距离依赖和上下文信息,聚焦于复杂背景中的目标。最后,采用空间增强注意力模块(Spatially Enhanced Attention Module,SEAM)解决小目标遮挡问题。试验结果表明,HD-YOLO算法在同一数据集上平均精度均值为81.8%,相比原始YOLOv8算法提高了5.0百分点。设计的HD-YOLO算法有效提高了复杂场景中佩戴安全帽的检测精度。 展开更多
关键词 安全社会工程 安全帽检测 YOLOv8算法 GRC-C2f模块 DSASF颈部结构 Focal modulation模块 空间增强注意力模块
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
2
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
在线阅读 下载PDF
基于深度学习的车道线检测算法
3
作者 岳永恒 赵志浩 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期22-30,共9页
针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现... 针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现图像的多尺度特征提取;接着,网络框架中设计多尺度空间注意力模块,且引入SimAM轻量级注意力机制,以增强对目标特征的聚焦能力;然后,设计自适应特征融合模块,通过智能调整不同尺度特征图的融合权重,对PANet输出的特征图进行跨尺度融合,以提升网络对复杂特征的提取能力。在TuSimple数据集上的实验结果表明,所提算法的检测精度为96.84%,较原算法提升了1.02个百分点,优于传统的主流算法;在CULane数据集上的实验结果表明,所提算法的F_(1)值为72.74%,优于传统的主流算法,较原算法提升了4.34个百分点,尤其在强光和阴影等极端场景下的检测性能提升显著,说明所提算法在复杂场景下具有优异的检测能力;实时性测试结果显示,所提算法的推理速度达118.0 f/s,满足智能车辆的实时性需求。 展开更多
关键词 车道线检测 深度学习 多尺度空间注意力机制 自适应特征融合
在线阅读 下载PDF
基于Densenet模型的步态相位识别研究 被引量:2
4
作者 付明凯 王少红 马超 《电子测量技术》 北大核心 2025年第1期119-128,共10页
步态识别是下肢外骨骼机器人的关键技术,精准地步态识别对下肢外骨骼机器人的柔性控制具有重要作用。为解决不同个体以及同一个体步态特征(步速、步幅等)的随机性,本文提出了一种基于Densenet改进的SECBAM-Densenet网络模型的步态相位... 步态识别是下肢外骨骼机器人的关键技术,精准地步态识别对下肢外骨骼机器人的柔性控制具有重要作用。为解决不同个体以及同一个体步态特征(步速、步幅等)的随机性,本文提出了一种基于Densenet改进的SECBAM-Densenet网络模型的步态相位识别方法。首先,将两个惯性测量单元布置在胫骨前部和大腿前侧的股直肌,采集了200人次受试者前进、转弯、上楼梯、下楼梯4种步态任务的步态数据。然后,对数据进行滤波重采样预处理后作为所提模型的输入。最后,利用SECBAM-Densenet模型得到输出模型的分类结果。结果显示,改进后SECBAM-Densenet模型在同一个体中不同步态相位平均识别准确率达到了95.76%,相比其他模型有0.66%~21.22%的提升。在不同个体中,相位的识别准确率均高于94%。以上试验结果表明,本文提出的模型可以应用于步态相位识别领域,并为下肢外骨骼机器人的柔性控制提供了试验参考。 展开更多
关键词 步态相位 Densenet SE-net注意力模块 空间通道注意力模块
在线阅读 下载PDF
基于MobileNet的轻量化云检测模型
5
作者 叶武剑 谢林峰 +2 位作者 刘怡俊 温晓卓 李扬 《自然资源遥感》 北大核心 2025年第3期95-103,共9页
针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制... 针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制和挤压激励(squeeze-and-excitation,SE)注意力模块来增强通道间的信息交流。通过这种方式,既减少了参数量和计算复杂度,又保持了对重要特征的提取能力。在上采样阶段,使用了RepConv模块和改进的空洞空间金字塔池化模块(atrous spatial pyramid pooling,ASPP),以提高网络的学习能力和捕捉图像细节与空间信息的能力。实验结果证明,该文模型在参数量和模型复杂度降低的情况下,能够实现较高精度的云检测,具备实用性和可行性。 展开更多
关键词 云检测 MobileNet网络 注意力机制 多尺度特征 空洞空间金字塔池化模块
在线阅读 下载PDF
联合边缘特征的物流驾驶员危险行为识别
6
作者 侯贵捷 王呈 +1 位作者 夏源 杜林 《计算机应用研究》 北大核心 2025年第4期1255-1261,共7页
准确识别物流驾驶员接打电话等危险行为是实现生产安全的重要一环。针对工业现场背景复杂、驾驶员手臂动作相似度高等问题,提出一种联合边缘特征的物流驾驶员危险行为识别算法EF-GCN(edge feature graph convolutional network)。首先,... 准确识别物流驾驶员接打电话等危险行为是实现生产安全的重要一环。针对工业现场背景复杂、驾驶员手臂动作相似度高等问题,提出一种联合边缘特征的物流驾驶员危险行为识别算法EF-GCN(edge feature graph convolutional network)。首先,提出基于自适应图卷积的空间感知模块,考虑人体运动过程中远离质心的边缘关节点,设计空间感知算法以提高权重分配。其次,设计时空边缘注意力模块,在时空均值化后添加边缘卷积,改善模型对边缘特征提取不充分的缺点;同时,引入可分离卷积SC block(separable convolution block),替换主干网络中的标准卷积,减少模型参数量。最后,构建相似特征识别网络SF-RN(similar feature recognition network),对接打电话、抽烟等手臂相似行为进行区分,强化算法对相似行为的识别能力。实验结果表明,EF-GCN较传统的时空图卷积网络识别精度提高10.4百分点,较基线模型提升3.2百分点,能够准确识别物流驾驶员的危险行为,验证了算法的有效性。 展开更多
关键词 边缘特征 空间感知 注意力模块 可分离卷积 相似特征识别
在线阅读 下载PDF
基于混合注意力生成对抗网络的遥感图像去雾方法
7
作者 马六 毛克彪 郭中华 《智慧农业(中英文)》 2025年第2期172-182,共11页
[目的/意义]近年来,深度学习在遥感图像去雾领域取得了显著进展,尤其是在引入注意力机制以提升特征学习方面。然而,传统的注意力机制大多依赖全局平均池化,导致模型对特定影响点的敏感性过高,难以有效应对遥感图像中的去雾问题。为了提... [目的/意义]近年来,深度学习在遥感图像去雾领域取得了显著进展,尤其是在引入注意力机制以提升特征学习方面。然而,传统的注意力机制大多依赖全局平均池化,导致模型对特定影响点的敏感性过高,难以有效应对遥感图像中的去雾问题。为了提高去雾技术的效果,满足农业、城市规划等领域对图像质量日益增长的需求,现有方法亟需改进。[方法]本研究提出了一种混合注意力生成对抗网络(Hybrid Attention-Based Generative Adversarial Network,HAB-GAN)。该模型通过结合高效通道注意力模块与空间注意力模块,嵌入生成对抗网络架构中,实现了对遥感图像去雾效果的显著提升。高效通道注意力模块通过降低全局特征聚合中的冗余信息,既保留了性能,又减少了模型复杂度;空间注意力模块则从局部到全局对遥感图像中的雾化区域进行识别和聚焦,增强了对这些区域的恢复能力。这种方法能够更加有效地应对遥感图像中复杂多变的景观,尤其适用于农业等需要高质量遥感数据的领域。[结果与讨论]在RESISC(Remote Sensing Image Scene Classification)45数据集上,与现有的其他注意力机制去雾模型,如SpA GAN和HyA-GAN进行比较,HAB-GAN模型去雾效果更优,其中峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)分别增加了2.64和1.14 dB,结构相似度(Structural Similarity Index,SSIM)分别增加了0.0122和0.0019。此外,消融实验验证了混合注意力机制的有效性,去除HAB模块后,HAB-GAN模型的PSNR下降了3.87 dB,SSIM下降了0.0334。[结论]提出的HAB-GAN模型显著提升了遥感图像的去雾效果,使生成的图像更加接近无雾图像,特别是对于复杂的农业、环境监测等场景具有重要应用价值。HAB模块在提升模型性能方面发挥了关键作用,为未来的遥感图像处理和相关领域提供了有力的技术支持。 展开更多
关键词 遥感图像 深度学习 生成对抗网络 高效通道注意力模块 空间注意力模块 去雾
在线阅读 下载PDF
基于相位参数估计和空间重建的自动调制识别
8
作者 张子胤 李大鹏 单国强 《电讯技术》 北大核心 2025年第11期1859-1868,共10页
针对现有深度学习调制识别算法在复杂信号环境下的鲁棒性和泛化能力不足的问题,提出了一种基于相位参数估计和空间重建的多通道网络(Phase Estimation and Spatial Reconstruction-based Attention Mechanism Multi-channel Network,PET... 针对现有深度学习调制识别算法在复杂信号环境下的鲁棒性和泛化能力不足的问题,提出了一种基于相位参数估计和空间重建的多通道网络(Phase Estimation and Spatial Reconstruction-based Attention Mechanism Multi-channel Network,PET-SAMCL)。首先,将输入的同相正交信号(In-phase Quadrature,IQ)通过相位参数估计转换,分成3个模块分别提取IQ的幅度-相位特征、IQ合路以及分路特征。在特征提取模块中加入空间重建单元(Spatial Reconstruction Unit,SRU),减少冗余特征的影响。利用全局平均池化和软注意力操作对空间特征进行提炼与融合,通过门控循环单元(Gated Recurrent Unit,GRU)及双向门控循环单元(Bidirectional Gated Recurrent Unit,BiGRU)提取时间和空间特征。通过消融实验确定了最优模型结构。该模型在RML2016.10a数据集上表现优异,在14 dB时达到了93.9%的最高识别准确率,平均识别率相较其他模型最大提高了7.7%。 展开更多
关键词 自动调制识别 深度学习 相位参数估计 空间重建单元 注意力机制
在线阅读 下载PDF
骨骼点特征提取下运动姿态异常识别
9
作者 赵国栋 李勇啸 沈梦英 《现代电子技术》 北大核心 2025年第21期88-92,共5页
为解决传统方法在姿态异常识别中存在的特征表达能力不足、对视角变化敏感等问题,文中提出一种骨骼点特征提取下运动姿态异常识别方法。利用人体姿态估计算法处理运动监控视频,提取多分支骨骼点特征后,将其作为基于自适应图卷积的运动... 为解决传统方法在姿态异常识别中存在的特征表达能力不足、对视角变化敏感等问题,文中提出一种骨骼点特征提取下运动姿态异常识别方法。利用人体姿态估计算法处理运动监控视频,提取多分支骨骼点特征后,将其作为基于自适应图卷积的运动姿态异常识别模型的输入;基于密集邻接的空间图卷积模块捕捉同一帧视频中关节点之间的空间结构关系;通过多尺度时间图卷积模块学习连续帧视频运动姿态的动态演变,将这两个模块的输出送入到注意力融合模块中;利用空间、时间、通道注意力机制强化特征表达,由全连接层输出运动姿态异常识别结果。实验结果表明:该方法可实现运动姿态异常识别,F_(1) score、APE、PSI、MVC指标值分别为91.53%、1.13、0.72、0.915,模型具有一定的泛化性和鲁棒性。 展开更多
关键词 骨骼点特征 人体姿态估计 空间图卷积 时间图卷积 关节点 注意力融合模块
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
10
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
融合PVTv2和DenseNet121的双注意力视网膜病变分级算法
11
作者 梁礼明 钟奕 +1 位作者 陈康泉 王成斌 《光电工程》 北大核心 2025年第4期15-29,共15页
针对视网膜眼底病变图像数据集类间分布不均和病灶区域识别困难的问题,提出一种融合金字塔视觉变压器(pyramid vision transformer v2,PVTv2)和DenseNet121双注意力视网膜病变分级算法。首先,该算法经由PVTv2和DenseNet121组成的双分支... 针对视网膜眼底病变图像数据集类间分布不均和病灶区域识别困难的问题,提出一种融合金字塔视觉变压器(pyramid vision transformer v2,PVTv2)和DenseNet121双注意力视网膜病变分级算法。首先,该算法经由PVTv2和DenseNet121组成的双分支网络,对视网膜图像的全局和局部信息进行初步提取;其次,在PVTv2和DenseNet121输出处分别采用空间通道协同注意力模块和多频率多尺度模块,优化局部特征细节,突显微小病灶特征,增强模型对复杂微小病变特征敏感性和病灶的定位感知;再次设计神经元交叉融合模块,建立病灶区域宏观布局和微观纹理信息之间的远程依赖关系,进而提高视网膜病变分级准确率;最后,利用混合损失函数缓解样本分布不均所导致的各等级之间模型关注度不平衡情况。在IDRID和APTOS 2019数据集上进行实验验证,其二次加权系数分别为90.68%和90.35%,IDRID数据集上的准确率和APTOS 2019数据集ROC曲线下方面积分别为80.58%和93.22%。实验结果表明,所提算法在视网膜病变分级领域具有一定应用价值。 展开更多
关键词 视网膜病变分级 空间通道协同注意力模块 多频率多尺度注意力模块 神经元交叉融合模块
在线阅读 下载PDF
基于改进Yolov8n的珊瑚白化图像目标检测
12
作者 韩云涛 刘宇鹏 +2 位作者 胡跃明 孙宝鹏 杨佳琪 《智能系统学报》 北大核心 2025年第5期1148-1157,共10页
针对海洋环境中珊瑚白化图像特征模糊、背景复杂多变导致的检测精度不足问题,在Yolov8n的基础上,提出了一种基于改进Yolov8n的针对珊瑚白化图像目标检测的Yolov8_CSHC算法。首先,利用防冗余结构紧凑倒置块(compact inverted block,CIB)... 针对海洋环境中珊瑚白化图像特征模糊、背景复杂多变导致的检测精度不足问题,在Yolov8n的基础上,提出了一种基于改进Yolov8n的针对珊瑚白化图像目标检测的Yolov8_CSHC算法。首先,利用防冗余结构紧凑倒置块(compact inverted block,CIB)改进C2f(concatenated feature fusion)模块,减少模型参数量以提高检测速度。其次,在特征融合网络中引入了基于局部注意力增强空间尺度聚合特征的空间金字塔池化网络,可以增强模型对局部细节的感知能力。最后,在特征融合过程中引入级联分组注意力机制,通过将输入特征分割处理,级联输出的方式提高了注意力的多样性和计算效率,使模型可以快速聚焦特征区域。后续引入混合注意力变换器,主要用于单图像超分辨率重建,进一步增强小目标的语义信息和全局感知能力。实验结果表明,在Marjan balance Dataset上,Yolov8_CSHC相较于Yolov8n算法,GFLOPS降低了12%,mAP@0.5-0.95提高了3.6百分点。该算法可以有效地完成海洋珊瑚白化状况的目标检测任务。 展开更多
关键词 Yolov8_CSHC 珊瑚白化检测 空间金字塔池化网络 级联分组注意力模块 CIB_C2f模块 混合注意力变换器 Marjan balance Dataset
在线阅读 下载PDF
动态空间Transformer与多级融合的视网膜病变分级算法
13
作者 梁礼明 钟奕 +1 位作者 康婷 金家新 《计算机工程与科学》 北大核心 2025年第8期1459-1469,共11页
针对糖尿病视网膜病变图像存在误分级和病灶边缘信息关注较少的问题,提出一种动态空间Transformer与多级融合视网膜病变分级算法。该算法首先将视网膜图像经PVT v2主干网络实现对病灶信息的初步提取;其次在网络前3层引入轮廓增强模块,... 针对糖尿病视网膜病变图像存在误分级和病灶边缘信息关注较少的问题,提出一种动态空间Transformer与多级融合视网膜病变分级算法。该算法首先将视网膜图像经PVT v2主干网络实现对病灶信息的初步提取;其次在网络前3层引入轮廓增强模块,凸显病灶边缘特征,提高算法对病灶像素的定位感知能力;再次在网络底层设计动态空间注意力模块,有效联系全局和局部空间信息,以提升算法挖掘深层语义信息的能力;最后构建多级门控融合模块,实现非诊断信息的滤除,同时对可诊断信息进行多级融合,进一步提高视网膜病变分级准确率。在IDRID和APTOS 2019数据集上进行实验验证,其二次加权系数分别为91.71%和89.89%,IDRID数据集上准确率和APTOS 2019数据集ROC曲线下方面积的占比分别为79.61%和93.06%。实验结果表明,所提出算法在视网膜病变分级领域具有一定应用价值。 展开更多
关键词 视网膜病变分级 动态空间注意力 轮廓增强模块 多级门控融合模块
在线阅读 下载PDF
基于门控注意力网络的调制信号分类识别算法
14
作者 许雪 姚文强 +1 位作者 李晨 郭业才 《现代电子技术》 北大核心 2025年第3期69-75,共7页
针对神经网络提取的信号特征不足导致信号识别率下降的问题,提出基于门控注意力网络的调制信号分类识别算法。该算法先对输入信号进行混合数据增强,生成更多维度的样本以便网络更好地提取信号特征;再将处理后的样本信号输入双通道网络(C... 针对神经网络提取的信号特征不足导致信号识别率下降的问题,提出基于门控注意力网络的调制信号分类识别算法。该算法先对输入信号进行混合数据增强,生成更多维度的样本以便网络更好地提取信号特征;再将处理后的样本信号输入双通道网络(CNN and BiLSTM Parallel),并行提取信号的空间特征和时间特征;最后将提取到的特征输入到门控注意力网络中,自适应地调整特征权重,减少网络复杂度。实验表明,文中提出的算法最高分类准确率为92.3%,优于对比的其他网络模型。 展开更多
关键词 自动调制识别 双通道网络 长短时记忆网络 门控注意力网络 空间特征 时间特征
在线阅读 下载PDF
基于改进YOLOv8的小目标检测算法
15
作者 邓立国 吴毅麒 《现代电子技术》 北大核心 2025年第14期169-177,共9页
小目标检测在自动驾驶、医学诊断、工业质检等领域的应用需求日益凸显。针对现有小目标检测算法存在的误检、漏检以及检测精度低等问题,提出一种基于改进YOLOv8的小目标检测算法,即PGA-YOLOv8。该算法以YOLOv8为基础模型,结合注意力机... 小目标检测在自动驾驶、医学诊断、工业质检等领域的应用需求日益凸显。针对现有小目标检测算法存在的误检、漏检以及检测精度低等问题,提出一种基于改进YOLOv8的小目标检测算法,即PGA-YOLOv8。该算法以YOLOv8为基础模型,结合注意力机制来提高对小目标的定位能力;在特征融合网络中改进特征融合策略(ASFF),增加1个检测层来学习浅层的特征,以更好地利用各层次特征信息;将YOLOv8模型中部分普通卷积替换为分组重组卷积(GSConv)以优化网络结构。最后,在常用基准数据集(VOC2012)和航空图像数据集(AI-TOD)上,以YOLOv8为基准模型设置多组实验,验证改进的各种技术的有效性以及PGA-YOLOv8算法的检测能力。实验结果表明,相较于YOLOv8算法,所提算法在两个数据集中平均精度均值(mAP)分别提高了2.576%和6.389%。 展开更多
关键词 小目标检测 YOLOv8 极化自注意力模块 自适应空间特征融合策略 分组重组卷积 性能评估
在线阅读 下载PDF
基于多尺度注意力和空间通道重构卷积的冲击回波频谱图像分类
16
作者 崔博 武冰冰 +3 位作者 陈伟 孟庆洪 王晓 黄祺祥 《南京信息工程大学学报》 北大核心 2025年第5期659-669,共11页
针对传统卷积神经网络对冲击回波信号频谱图像进行分类时,面临卷积神经网络特征提取能力不足和数据集类别不平衡的问题,提出一种基于多尺度注意力和空间通道重构卷积的神经网络模型(Multi-scale Hybrid Attention and Spatial Channel R... 针对传统卷积神经网络对冲击回波信号频谱图像进行分类时,面临卷积神经网络特征提取能力不足和数据集类别不平衡的问题,提出一种基于多尺度注意力和空间通道重构卷积的神经网络模型(Multi-scale Hybrid Attention and Spatial Channel Reconstruction Convolutional Neural Network,MHA-SCConvNet).首先设计了多尺度混合注意力(Multi-scale Hybrid Attention,MHA)模块,用于提取不同尺度的频谱图像特征并增强模型对频谱波形关键信息的关注力度.其次,引入空间通道重构卷积(Spatial and Channel Reconstruction Convolution,SCConv)模块,通过优化图像特征的表示来降低特征冗余.最后,提出了新的混合损失函数GDHM Loss(Gradient and Distribution Harmonized Margin Loss,梯度与分布协调边距损失),该损失函数在动态情况下同时考虑难分类样本和少数类样本.在自建的数据集上进行了训练与测试,并与AlexNet、VGGNet、GoogLeNet等分类模型对比,MHA-SCConvNet准确率达到94.58%.实验结果表明,MHA-SCConvNet模型能够有效提高冲击回波信号频谱图像分类的准确率和效率. 展开更多
关键词 频谱图像分类 多尺度注意力模块 卷积神经网络 混合损失函数 空间通道重构卷积
在线阅读 下载PDF
改进ESP-YOLO的PCB缺陷检测算法
17
作者 王海群 王炳楠 葛超 《计算机工程与科学》 北大核心 2025年第2期317-326,共10页
PCB板的缺陷检测是保证其质量的重要手段。为了避免漏检、误检现象的发生,并提高PCB缺陷检测速度,提出了一种改进ESP-YOLO的PCB缺陷检测算法。引入ESP网络结构,通过ESPblock实现下采样,并改进特征提取模块,采用更轻量的网络结构实现特... PCB板的缺陷检测是保证其质量的重要手段。为了避免漏检、误检现象的发生,并提高PCB缺陷检测速度,提出了一种改进ESP-YOLO的PCB缺陷检测算法。引入ESP网络结构,通过ESPblock实现下采样,并改进特征提取模块,采用更轻量的网络结构实现特征提取,解决PCB缺陷检测模型较大并且难以部署的问题;引入一种无参数注意力机制SimAM,在不增加网络参数的同时提高复杂环境中算法对目标的关注度,解决由于背景复杂导致的PCB缺陷漏检问题;引入RFB多尺度特征提取模块,扩大算法感受野并提高多尺度特征提取能力,解决由于缺陷大小差异导致的漏检问题;引入可学习参数特征融合模块BiFPN,提高融合特征图的特征表达能力。实验结果显示,ESP-YOLO算法的参数量和GFLOPs分别为5.32×106和11.2,相比YOLOv5s算法分别降低了23.8%和29.1%;平均精度为97.8%,相比于原YOLOv5s算法提升了3.2%。 展开更多
关键词 PCB缺陷检测 ESPNet SimAM RFB BiFPN YOLOv5s
在线阅读 下载PDF
一种基于SAM-MSFF网络的低照度目标检测方法 被引量:3
18
作者 江泽涛 李慧 +3 位作者 雷晓春 朱玲红 施道权 翟丰硕 《电子学报》 EI CAS CSCD 北大核心 2024年第1期81-93,共13页
由于低照度图像具有对比度低、细节丢失严重、噪声大等缺点,现有的目标检测算法对低照度图像的检测效果不理想.为此,本文提出一种结合空间感知注意力机制和多尺度特征融合(Spatial-aware Attention Mechanism and Multi-Scale Feature F... 由于低照度图像具有对比度低、细节丢失严重、噪声大等缺点,现有的目标检测算法对低照度图像的检测效果不理想.为此,本文提出一种结合空间感知注意力机制和多尺度特征融合(Spatial-aware Attention Mechanism and Multi-Scale Feature Fusion,SAM-MSFF)的低照度目标检测方法 .该方法首先通过多尺度交互内存金字塔融合多尺度特征,增强低照度图像特征中的有效信息,并设置内存向量存储样本的特征,捕获样本之间的潜在关联性;然后,引入空间感知注意力机制获取特征在空间域的长距离上下文信息和局部信息,从而增强低照度图像中的目标特征,抑制背景信息和噪声的干扰;最后,利用多感受野增强模块扩张特征的感受野,对具有不同感受野的特征进行分组重加权计算,使检测网络根据输入的多尺度信息自适应地调整感受野的大小.在ExDark数据集上进行实验,本文方法的平均精度(mean Average Precision,mAP)达到77.04%,比现有的主流目标检测方法提高2.6%~14.34%. 展开更多
关键词 低照度图像 目标检测 空间感知注意力机制 多尺度特征融合 多感受野增强模块
在线阅读 下载PDF
复杂作业场景下的反光衣和安全帽检测方法 被引量:4
19
作者 谢国波 肖峰 +2 位作者 林志毅 谢建辉 吴陈锋 《安全与环境学报》 CAS CSCD 北大核心 2024年第9期3513-3521,共9页
针对现有算法在复杂的工地环境中进行反光衣和安全帽检测时存在的无法有效区分目标和背景的微小差异问题,提出了一种改进YOLOX的反光衣和安全帽检测算法。首先,将主干网络中空间金字塔池化中的最大池化替换为平均池化,减少特征图的信息... 针对现有算法在复杂的工地环境中进行反光衣和安全帽检测时存在的无法有效区分目标和背景的微小差异问题,提出了一种改进YOLOX的反光衣和安全帽检测算法。首先,将主干网络中空间金字塔池化中的最大池化替换为平均池化,减少特征图的信息损失和过拟合风险;其次,设计一种带权注意力模块(Weighted Convolutional Block Attention Module,W-CBAM)嵌入特征融合层,通过权重系数提升对特征图空间维度的关注,增强特征图的表达能力;最后,添加自适应特征融合(Adaptively Spatial Feature Fusion,ASFF)模块,解决多尺度特征融合时存在的不一致性问题。在扩充后的公开反光衣安全帽数据集的试验结果表明,所提算法精度高达98.79%,优于原始的YOLOX算法和其他先进算法,同时具有较快的检测速度,满足施工环境检测需求。 展开更多
关键词 安全工程 反光衣检测 安全帽检测 YOLOX 注意力模块 自适应特征融合
在线阅读 下载PDF
基于双流自适应时空增强图卷积网络的手语识别 被引量:2
20
作者 金彦亮 吴筱溦 《应用科学学报》 CAS CSCD 北大核心 2024年第2期189-199,共11页
针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使... 针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使用人体身体、手部和面部节点作为输入,构造基于人体关节和骨骼的双流结构。通过自适应时空图卷积模块生成不同部位之间的连接,并充分利用其中的位置和方向信息。同时采用残差连接方式设计自适应多尺度时空注意力模块,进一步增强该网络在空域和时域的卷积能力。将双流网络提取到的有效特征进行加权融合,可以分类输出手语词汇。最后在公开的中文手语孤立词数据集上进行实验,在100类词汇和500类词汇分类任务中准确率达到了95.57%和89.62%。 展开更多
关键词 骨架数据 双流结构 自适应时空图卷积模块 自适应多尺度时空注意力模块 特征融合
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部