期刊文献+
共找到378篇文章
< 1 2 19 >
每页显示 20 50 100
Multi-scale object detection by top-down and bottom-up feature pyramid network 被引量:14
1
作者 ZHAO Baojun ZHAO Boya +2 位作者 TANG Linbo WANG Wenzheng WU Chen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第1期1-12,共12页
While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection ... While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection of objects with multiple aspect ratios and scales is still a key problem. This paper proposes a top-down and bottom-up feature pyramid network(TDBU-FPN),which combines multi-scale feature representation and anchor generation at multiple aspect ratios. First, in order to build the multi-scale feature map, this paper puts a number of fully convolutional layers after the backbone. Second, to link neighboring feature maps, top-down and bottom-up flows are adopted to introduce context information via top-down flow and supplement suboriginal information via bottom-up flow. The top-down flow refers to the deconvolution procedure, and the bottom-up flow refers to the pooling procedure. Third, the problem of adapting different object aspect ratios is tackled via many anchor shapes with different aspect ratios on each multi-scale feature map. The proposed method is evaluated on the pattern analysis, statistical modeling and computational learning visual object classes(PASCAL VOC)dataset and reaches an accuracy of 79%, which exhibits a 1.8% improvement with a detection speed of 23 fps. 展开更多
关键词 convolutional neural network (CNN) feature pyramid network (fpn) object detection deconvolution.
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
2
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks Multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
ResFPN:扩增实际感受野和改进FPN的多尺度目标检测方法 被引量:1
3
作者 杨扬 唐晓芬 《计算机工程与应用》 北大核心 2025年第10期247-257,共11页
针对多尺度目标检测中主干网络实际感受野远远小于理论感受野,感受野分布稀疏,以及特征金字塔网络(feature pyramid network,FPN)在横向连接过程中统一通道数会丢失通道信息等影响模型性能的问题,提出一种扩增实际感受野和多特征融合改... 针对多尺度目标检测中主干网络实际感受野远远小于理论感受野,感受野分布稀疏,以及特征金字塔网络(feature pyramid network,FPN)在横向连接过程中统一通道数会丢失通道信息等影响模型性能的问题,提出一种扩增实际感受野和多特征融合改进FPN的多尺度目标检测算法ResFPN。针对主干网络实际感受野远远小于理论感受野的问题,设计了多分支膨胀卷积(multi-branch dilated convolutional,MBD)模块和多分支池化(multi-branch pooling,MBP)模块,通过学习不同尺度空间特征融合,扩增感受野。针对感受野分布稀疏问题,提出轻量级通道交互融合(channel interactive fusion,CIF)模块,通过双分支结构并在每一分支叠加不同数量深度可分离卷积学习像素间的依赖关系增强特征表示。针对FPN通过1×1卷积统一通道数会丢失通道信息的问题,尝试利用SubPixel卷积提取C5层输出特征,保留原始丰富语义信息的同时引出额外双向路径对FPN通道信息进行补充,但这可能会产生冗余信息。因此,在额外双向路径后引入全局上下文(global context,GC)模块,利用GC瓶颈转换模块进一步融合特征信息,减少信息冗余。实验表明,提出的ResFPN有效解决了感受野分布稀疏问题,并将主干网络感受野增大为原来的一倍,同时提出的改进FPN通道丢失问题的方法也在多尺度目标检测中获得了良好的性能。与典型的网络Faster R-CNN相比,大、中、小物体检测平均精度在具有挑战性的MS COCO数据集上分别提高了2.2、1.6、2.0个百分点,与其他检测器相比检测效果也有提升。 展开更多
关键词 目标检测 卷积神经网络 多尺度目标检测 感受野 特征金字塔网络(fpn)
在线阅读 下载PDF
基于改进FPN模型的西瓜幼苗智能识别方法 被引量:1
4
作者 李彦勤 王晓婷 《中国农机化学报》 北大核心 2024年第12期148-153,共6页
为提高对不同时期西瓜幼苗智能识别的准确度和运行效率,采用深度学习技术提出改进特征金字塔模型(FPN)的智能识别方法。首先结合特征金字塔网络模型和Res2Net模型设计网络模型,利用有效通道注意力机制(ECA)赋予空间特征不同权重,采用通... 为提高对不同时期西瓜幼苗智能识别的准确度和运行效率,采用深度学习技术提出改进特征金字塔模型(FPN)的智能识别方法。首先结合特征金字塔网络模型和Res2Net模型设计网络模型,利用有效通道注意力机制(ECA)赋予空间特征不同权重,采用通道参数共享的方式,降低模型的计算复杂度;然后采用残差结构对模型进行优化改进,在不增加训练参数的情况下,解决网络深度不断提升时出现的网络退化问题;最后在全连接层使用深度可分离卷积替换传统卷积,从而大幅减少计算量,实现轻量化的设计。对不同生长期西瓜幼苗叶片进行试验。结果表明:与几种较为先进的识别算法相比,提出的识别方法具有更高的识别准确度和最短的运算耗时,识别率达到96.84%,等误率仅为0.54%,平均精度mAP达到91.68%,运算耗时低至112 ms,为推动智慧农业的发展和实现智能化的农业管理决策提供技术保障。 展开更多
关键词 农作物表型识别 深度学习 特征金字塔 残差网络 多尺度特征 可分离卷积
在线阅读 下载PDF
基于LWKConv-DRSN-FPN的旋转机械故障诊断 被引量:1
5
作者 伍兴 李志伟 +1 位作者 宁文乐 郑照 《噪声与振动控制》 CSCD 北大核心 2024年第5期133-139,共7页
针对传统旋转机械故障诊断方法难以应对强噪声干扰以及诊断准确率较低的问题,提出一种Laplace小波核卷积层(Laplace Wavelet Kernel Convolutional Layer,LWKConv)、深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)和特征金... 针对传统旋转机械故障诊断方法难以应对强噪声干扰以及诊断准确率较低的问题,提出一种Laplace小波核卷积层(Laplace Wavelet Kernel Convolutional Layer,LWKConv)、深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)和特征金字塔网络(Feature Pyramid Networks,FPN)相结合的故障诊断方法。具体地,在DRSN模型结构基础上,构造LWKConv,通过更新尺度因子和平移因子,多尺度提取故障引起的突变冲击特征;引入FPN融合深层和浅层特征,提高模型对浅层细节信息的利用程度,实现对旋转机械的故障诊断。研究表明:所提的LWKConv-DRSN-FPN方法基于轴承和齿轮数据集的诊断准确率最高能达到100%,尤其在-4 dB强噪声干扰条件下的诊断准确率达到97.75%,能有效提取突变冲击特征,具有较好的通用性和抗强噪声干扰能力。 展开更多
关键词 故障诊断 旋转机械 Laplace小波核卷积层 深度残差收缩网络 特征金字塔网络
在线阅读 下载PDF
一种基于元学习的改进YOLO钢管表面缺陷小样本检测模型 被引量:2
6
作者 李凌波 田彦 +1 位作者 江旭东 董宝力 《机电工程》 北大核心 2025年第5期985-993,共9页
针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取... 针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取了特征图的判别能力;然后,为了提高特征融合能力并降低计算复杂度,通过加权双向特征金字塔网络(BiFPN)结构优化了特征提取器的颈部网络,平衡了YOLO-SBN模型的有效性和效率;最后,采用归一化注意力模块(NAM)优化权重调整了模块,增强了浅层缺陷特征的模型表达,并基于这些增强的特征进行了检测;使用金属表面热轧缺陷公开数据集NEU-DET验证了YOLO-SBN模型的算法性能。研究结果表明:对于小样本缺陷检测,YOLO-SBN模型在平均准确率(mAP)方面提高了4.1%;在新类缺陷样本规模数量为50的小样本情况下,改进后的检测模型对新类数据适应性最强。由此可见,该YOLO-SBN模型在提高检测精度和提升模型泛化能力方面具有一定优势。 展开更多
关键词 小样本目标检测 表面缺陷 元学习 特征网络 归一化注意力模块 平均准确率 双向特征金字塔网络(Bifpn)
在线阅读 下载PDF
基于GAN和多尺度空间注意力的多模态医学图像融合 被引量:3
7
作者 林予松 李孟娅 +1 位作者 李英豪 赵哲 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期1-8,共8页
针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图... 针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图像;其次,整个对抗网络框架采用双鉴别器结构,使得生成器生成的融合图像同时保留多个模态图像的显著特征;最后,构建一种多尺度空间注意力作为编码器进行特征提取的基本模块,利用多尺度结构充分捕获并保留源图像的多尺度特征,并且引入空间注意力更好地保留源图像的结构和细节信息。全脑图谱数据库上的实验结果表明:所提算法生成的融合图像不仅纹理细节更为丰富,有助于人类视觉观察,而且在3种不同类型的医学图像融合任务上平均梯度、峰值信噪比、互信息、视觉信息保真度等客观评价指标的平均值分别达到0.3023、20.7207、1.4414、0.6498,与其他先进的算法相比具有一定的优势。 展开更多
关键词 图像融合 多模态医学图像 生成对抗网络 特征金字塔 注意力机制
在线阅读 下载PDF
基于改进YOLOv5的密集行人检测算法 被引量:2
8
作者 胡倩 皮建勇 +2 位作者 胡伟超 黄昆 王娟敏 《计算机工程》 北大核心 2025年第3期216-228,共13页
针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨... 针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积,有效缓解特征信息丢失的问题;其次,针对非相邻特征图不直接融合从而引起特征融合率较低的问题,提出新的双层渐进金字塔网络(DAFPN),提高行人检测的准确性和精度;最后,基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数,以调整和提高帧回归率,促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型,mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点;引入EfficiCIoU_Loss后,模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展,提高了其在实际应用中的性能和效率。 展开更多
关键词 密集行人检测 小目标行人检测 Conv-SPD网络 双层渐进特征金字塔网络 EfficiCIoU_Loss损失函数
在线阅读 下载PDF
多尺度和多层级特征融合的人体姿态估计 被引量:2
9
作者 王燕妮 胡敏 +2 位作者 韩世鹏 陈艺瑄 吕昊 《计算机工程与应用》 北大核心 2025年第6期199-209,共11页
人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(m... 人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(multi-scale and multi-level network,MSLNet)。采用高分辨率网络(high-resolution network,HRNet)作为主干,通过跨尺度信息交互,实现不同分辨率特征图之间的信息交换,获取同时包含细粒度和粗粒度的姿态特征;引入期望最大化注意力-加权双向特征金字塔网络(expectation maximization attention-bidirectional feature pyramid network,EMA-BiFPN),实现多尺度特征融合后的多层级特征聚合,从局部到全局捕捉人体姿态的细节和关联信息;设计由残差结构组成的关键点检测头,完成输出特征的最终融合并提升人体关键点检测准确率。实验结果表明,MSLNet在COCO和MPII数据集上分别取得了75.8%和91.1%的准确率,实现了最优精度,充分验证了MSLNet能够融合尺度和层级之间的互补特征,进而提升人体姿态估计精度。 展开更多
关键词 高分辨率网络(HRNet) 人体姿态估计 期望最大化注意力 双向特征金字塔网络 特征融合
在线阅读 下载PDF
基于动态自适应通道注意力特征融合的小目标检测
10
作者 吴迪 赵品懿 +2 位作者 甘升隆 沈学军 万琴 《电子科技大学学报》 北大核心 2025年第2期221-232,共12页
针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的... 针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的问题。2)提出一种分组批量动态自适应通道注意力模块,增强弱语义小目标特征同时抑制无用信息,且在动态自适应通道注意力模块中设计新的激活函数和交并比损失函数,提升通道注意力表征能力。3)采用ResNet50作为骨干网络依次连接特征金字塔网络和Tri-Neck网络。实验结果表明,该方法在Pascal Voc 2007、Pascal Voc 2012上比YOLOv8算法mAP分别提升5.3%和6.2%,在MS COCO 2017数据集上AP和AP_S分别提升1.6%和2%,在SODA-D数据集上比YOLOv8算法AP提升0.9%。 展开更多
关键词 小目标检测 多尺度融合特征 特征金字塔 动态通道注意力 交并比损失函数
在线阅读 下载PDF
融合多尺度特征和多重注意力的棉田杂草检测研究
11
作者 帖军 龙吕佳 +2 位作者 郑禄 刘娇 巴桑顿珠 《中国农机化学报》 北大核心 2025年第10期138-145,共8页
针对现有棉田杂草检测方法识别杂草类别少、精度低的问题,提出一种融合多尺度特征和多重注意力的棉田杂草检测方法。首先,在骨干网络中引入高效多尺度注意力模块提升模型的特征提取能力,同时不增加模型参数量与计算量;其次,在头部网络... 针对现有棉田杂草检测方法识别杂草类别少、精度低的问题,提出一种融合多尺度特征和多重注意力的棉田杂草检测方法。首先,在骨干网络中引入高效多尺度注意力模块提升模型的特征提取能力,同时不增加模型参数量与计算量;其次,在头部网络添加渐进特征金字塔,进一步增强特征融合效果;最后,通过改进框回归损失函数提升模型的收敛速度和定位精度。在CottonWeedDet12数据集上进行试验,结果表明,该方法检测平均精度均值mAP达到94.6%,F1分数为0.754。相比于原始模型,mAP提高2.62%,召回率提高3.16%,同时检测时间为65.359 ms,满足实时检测的要求。该方法能够很好地解决自然环境下棉田杂草的精确检测问题,为棉田智能除草设备的研究提供参考。 展开更多
关键词 棉田 杂草检测 YOLOv8算法 注意力机制 特征金字塔
在线阅读 下载PDF
面向复杂背景环境下垃圾检测的YOLOv8n轻量化改进
12
作者 孙世政 何玲玲 +2 位作者 郑帅 徐向阳 陈仁祥 《电子测量与仪器学报》 北大核心 2025年第2期136-146,共11页
垃圾检测与分类对推动绿色经济和实现低碳循环具有重要意义,面向复杂背景环境的垃圾检测模型存在参数量大、计算成本高等问题,限制了模型在资源受限设备上的应用。为解决上述问题,提出一种轻量化的GCAW-YOLOv8n模型,旨在平衡模型轻量化... 垃圾检测与分类对推动绿色经济和实现低碳循环具有重要意义,面向复杂背景环境的垃圾检测模型存在参数量大、计算成本高等问题,限制了模型在资源受限设备上的应用。为解决上述问题,提出一种轻量化的GCAW-YOLOv8n模型,旨在平衡模型轻量化与精度检测。首先,在YOLOv8n骨干网络中引入GhostNet网络中的C3Ghost和GhostConv模块,有效降低模型参数量;其次,添加上下文锚点注意力机制,增强特征提取能力,提升检测精度;然后,在特征融合阶段,构建渐近特征金字塔网络,提升多尺度目标检测能力;接着,采用WIoU v3边界损失函数优化网络边界框回归性能;最后,结合Taco数据集和人工采集数据集进行了模型验证实验。实验结果表明,相比原YOLOv8n模型,改进后的GCAW-YOLOv8n模型在模型参数量Params和计算量FLOPs分别降低了14.3%和33.3%,而精确度和召回率分别提高了4.4%和1.9%,同时mAP@0.5达到了81.3%,提升了0.7%。改进模型更好地平衡了模型轻量化和检测精度,对模型部署与应用至边缘端检测装备具有重要的工程意义。 展开更多
关键词 垃圾检测 轻量化YOLOv8n GhostNet 上下文锚点注意力机制 渐近特征金字塔
在线阅读 下载PDF
一种基于轻量化卷积模块的语义分割网络
13
作者 连晓峰 康毛毛 +1 位作者 谭励 王艳莉 《应用科学学报》 北大核心 2025年第1期66-79,共14页
融合深度学习的语义同步定位与地图构建技术为处理动态场景提供了有效的解决方案,但仍面临计算资源消耗大和模型复杂度高的挑战。为此,提出了一种基于BlendMask改进的轻量化语义分割网络。首先,设计了一种轻量的GDS-ECA卷积(Ghost-depth... 融合深度学习的语义同步定位与地图构建技术为处理动态场景提供了有效的解决方案,但仍面临计算资源消耗大和模型复杂度高的挑战。为此,提出了一种基于BlendMask改进的轻量化语义分割网络。首先,设计了一种轻量的GDS-ECA卷积(Ghost-depthwise separable convolution with efficient channel attention)模块,利用深度可分离卷积替代Ghost卷积中的少量卷积操作,减少参数量和计算量,并添加注意力机制提升特征表达能力。其次,提出了特征提取网络BGTNet(bottleneck GDS-ECA attention transformer network),将GDS-ECA卷积应用于颈部模块的卷积层以提升网络的提取精度;此外,将特征金字塔网络(feature pyramid network,FPN)中的传统卷积替换为GDS-ECA卷积,构建轻量化特征金字塔网络,并结合BGTNet形成语义分割网络的主干网。最后在数据集COCO上进行了实验验证,改进后的模型处理图像时间缩短了7.3 ms,平均精度提升了1.5%。 展开更多
关键词 语义分割 同步定位与地图构建 轻量化 注意力机制 特征金字塔
在线阅读 下载PDF
基于卷积神经网络的线结构光高精度三维测量方法
14
作者 叶涛 何威燃 +2 位作者 刘国鹏 欧阳煜 王斌 《仪器仪表学报》 北大核心 2025年第2期183-195,共13页
线结构光视觉三维测量技术因其高精度和非接触的三维重建优势而被广泛应用。然而,现有的线结构光三维测量方法在标定过程中往往面临较高的耦合性问题,且在复杂环境下,背景噪声和光照变化会严重干扰条纹的提取,导致结构光条纹中心定位精... 线结构光视觉三维测量技术因其高精度和非接触的三维重建优势而被广泛应用。然而,现有的线结构光三维测量方法在标定过程中往往面临较高的耦合性问题,且在复杂环境下,背景噪声和光照变化会严重干扰条纹的提取,导致结构光条纹中心定位精度下降,进而影响整体三维测量的精度和鲁棒性。针对上述问题,提出了一种基于卷积神经网络的鲁棒三维测量方法。首先,设计了一种创新性的残差U型块特征金字塔网络(RSU-FPN),旨在实现背景噪声的干扰抑制和结构光条纹区域中心的高精度鲁棒提取。其次,构建了一种新型的线结构光视觉传感器,并提出了一种分离式测量模型,成功将摄像机标定与光平面标定解耦,极大地提高了系统的灵活性与扩展性。通过这种解耦的标定方式,避免了传统标定方法中存在的耦合问题,使得整个测量系统更加高效且易于调整。实验结果表明,所提出的基于卷积神经网络的鲁棒三维测量方法,在复杂背景下能够实现结构光条纹中心的高精度提取,利用提取出的光条纹中心进行标定,其均方根误差分别为x方向0.005 mm、y方向0.009 mm以及z方向0.097 mm。并且,该方法在不同表面类型(如漫反射表面和光滑反射表面)上均能实现高精度的三维重建,验证了其在实际应用中的优越性和强大的鲁棒性。 展开更多
关键词 线结构光 三维测量 卷积神经网络 残差U型块特征金字塔网络 背景噪声抑制
在线阅读 下载PDF
基于改进YOLOv5的小目标交通标志检测算法
15
作者 李牧 陶启婷 柯熙政 《计算机应用》 北大核心 2025年第S1期239-244,共6页
交通标志检测是自动驾驶系统、辅助驾驶系统(DAS)的重要组成部分,对行车安全具有重要意义。针对小目标交通标志检测时受光照、恶劣天气等因素影响而导致的检测精度低、漏检率高等问题,提出一种基于改进YOLOv5的小目标交通标志检测算法... 交通标志检测是自动驾驶系统、辅助驾驶系统(DAS)的重要组成部分,对行车安全具有重要意义。针对小目标交通标志检测时受光照、恶劣天气等因素影响而导致的检测精度低、漏检率高等问题,提出一种基于改进YOLOv5的小目标交通标志检测算法。首先,引入空间到深度卷积(SPD-Conv)对特征图进行下采样,有效避免小目标信息丢失,提高小目标敏感度。其次,基于加权双向特征金字塔网络(BiFPN)改进颈部网络,添加跨层连接以融合多尺度特征。之后,增加小目标检测层,增强小目标检测能力。最后,采用SIoU(Shape-aware Intersection over Union)损失函数,关注真实框与预测框的角度信息。实验结果表明,改进后的算法在中国交通标志检测数据集(CCTSDB2021)上的平均精度均值(mAP)达到83.5%,相较于原YOLOv5提升了7.2个百分点,检测速度满足实时性要求。 展开更多
关键词 小目标检测 YOLOv5 交通标志检测 SPD-Conv Bifpn
在线阅读 下载PDF
基于渐进特征融合及多尺度空洞注意力的遮挡鸟巢检测
16
作者 尹向雷 屈少鹏 +1 位作者 解永芳 苏妮 《浙江大学学报(工学版)》 北大核心 2025年第3期535-545,共11页
为了提高被遮挡鸟巢目标的检测性能与准确性,减少鸟类筑巢对电力系统稳定运行造成的威胁以及运维成本,提出基于改进YOLOv5的输电线路鸟巢检测方法.该方法使用渐进特征金字塔网络优化原始特征金字塔网络结构,有效避免了非相邻层次之间较... 为了提高被遮挡鸟巢目标的检测性能与准确性,减少鸟类筑巢对电力系统稳定运行造成的威胁以及运维成本,提出基于改进YOLOv5的输电线路鸟巢检测方法.该方法使用渐进特征金字塔网络优化原始特征金字塔网络结构,有效避免了非相邻层次之间较大的语意差距,增强了非相邻层次间的融合效果.使用多尺度空洞注意力机制,使模型能够有效地提取不同尺度的语义信息,提高模型对遮挡鸟巢目标的检测性能.采用轻量级Mobile-NetV3网络作为骨干网络,进一步降低模型复杂度.消融实验与定性实验结果表明,改进后算法的召回率、精确率与平均精度均值相较于原始算法分别提升了2.0个百分点、0.7个百分点与1.7个百分点,权重大小与计算量分别减少了74.7个百分点与53.5个百分点.对于遮挡鸟巢目标均表现出良好的性能,验证了改进方法的有效性. 展开更多
关键词 输电线路 遮挡目标 YOLOv5 注意力机制 渐进特征金字塔网络
在线阅读 下载PDF
基于改进YOLOX的隧道火灾检测算法
17
作者 马庆禄 邱高建 白锋 《中国安全科学学报》 北大核心 2025年第4期28-34,共7页
针对隧道初期火灾检测中存在的复杂环境干扰和低识别率问题,提出一种基于改进YOLOX算法的检测方法YOLOX-T。该方法在YOLOX中引入归一化注意力模块(NAM)机制来抑制环境噪声和干扰,提高系统的鲁棒性及识别的精确性;引入加权双向特征金字... 针对隧道初期火灾检测中存在的复杂环境干扰和低识别率问题,提出一种基于改进YOLOX算法的检测方法YOLOX-T。该方法在YOLOX中引入归一化注意力模块(NAM)机制来抑制环境噪声和干扰,提高系统的鲁棒性及识别的精确性;引入加权双向特征金字塔网络(BiFPN)增强特征提取和融合能力,优化α-交并比(IoU)损失函数,以提高对轮廓特征不明显的隧道初期烟雾火焰的检测精度;在现有公开数据集不足的情况下,通过网络采集、模拟试验和扩充现有数据集,构建隧道火灾数据集,在包含真实场景和模拟场景的自建隧道火灾数据集上进行验证。结果表明:相比于原始YOLOX模型,改进后的算法均值平均精度(mAP@0.5)提高1.89%,mAP@0.5~0.95提高0.88%,精确率提高4.57%,召回率提高5.45%,改进后的算法能够实现更优的检测性能。 展开更多
关键词 隧道火灾 YOLOX 火灾检测 归一化注意力模块(NAM) 加权双向特征金字塔网络(Bifpn)
在线阅读 下载PDF
基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别
18
作者 毛清华 苏毅楠 +3 位作者 贺高峰 翟姣 王荣泉 尚新芒 《工矿自动化》 北大核心 2025年第1期11-20,103,共11页
针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换... 针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换主干网络C2f模块为C2fER模块,加强模型的细节特征提取能力,提升模型对小目标人员的识别性能;通过在颈部网络引入特征强化加权双向特征金字塔网络(FE-BiFPN)结构,提高模型的特征融合能力,从而提升模型对多尺度人员目标的识别效果;通过引入分离增强注意力模块(SEAM)增强模型在复杂背景下对局部特征的关注度,提升模型对遮挡目标人员的识别能力;通过引入WIoU损失函数增强训练效果,提升模型识别准确率。消融实验结果表明:改进YOLOv8模型的准确率较基线模型YOLOv8s提升2.3%,mAP@0.5提升3.4%,识别速度为104帧/s。人员识别实验结果表明:与YOLOv10m,YOLOv8s-CA、YOLOv8s-SPDConv和YOLO8n模型相比,改进YOLOv8模型对小目标、多尺度目标、遮挡目标的识别效果均更佳,识别准确率为90.2%,mAP@0.5为87.2%。人员入侵危险区域实验结果表明:井下人员入侵带式输送机危险区域智能识别系统判别人员入侵危险区域的平均准确率为93.25%,满足识别需求。 展开更多
关键词 煤矿带式输送机 人员入侵危险区域 YOLOv8模型 遮挡目标检测 小目标检测 多尺度融合 C2fER模块 特征强化加权双向特征金字塔网络结构
在线阅读 下载PDF
融合注意力机制的荔枝轻量化检测方法研究 被引量:1
19
作者 王聪 文晟 +4 位作者 兰玉彬 严倩 姜永华 张建桃 罗菊川 《农机化研究》 北大核心 2025年第3期10-15,共6页
针对荔枝果实个体小、生长密集和遮挡严重等特点,为了快速准确地实现荔枝的检测和计数,提出了一种融合注意力机制和多尺度特征图的网络模型。为了提高模型对遮挡和阴影环境下果实的识别准确率,将Coordinate Attention(CA)注意力机制嵌入... 针对荔枝果实个体小、生长密集和遮挡严重等特点,为了快速准确地实现荔枝的检测和计数,提出了一种融合注意力机制和多尺度特征图的网络模型。为了提高模型对遮挡和阴影环境下果实的识别准确率,将Coordinate Attention(CA)注意力机制嵌入至YOLOv4-Tiny模型。为了提高模型对小目标果实的检测精度,在特征金字塔Feature Pyramid Networks(FPN)结构中生成了两个更大尺度的特征图。试验结果表明:融合注意力机制的荔枝轻量化检测模型的准确率(Precision)、召回率(Recall)和平均精度(mAP)分别为92.92%、76.09%和88.51%。与YOLOv4-Tiny和YOLOv3模型相比,所构建的融合注意力机制的荔枝轻量化检测模型的平均检测精度分别高出8.84个百分点和3.87个百分点。该模型能够快速、精准地检测出果园环境中的荔枝,适用于果园中荔枝的识别和计数。 展开更多
关键词 荔枝 注意力机制 特征金字塔 轻量化 检测方法
在线阅读 下载PDF
远距离情形下的改进YOLOv8行人检测算法 被引量:1
20
作者 汤静雯 赖惠成 王同官 《计算机工程》 北大核心 2025年第4期303-313,共11页
智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生,然而面对遮挡和远距离行人的情景,现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题,提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取... 智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生,然而面对遮挡和远距离行人的情景,现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题,提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM),使得网络更好地学习行人特征和捕捉行人特点,在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块,重新整合后的检测层增强了网络对小目标的识别能力,有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络,即双向扩张残差-特征金字塔网络(BDR-FPN),利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征,缓解网络对遮挡行人不敏感问题。实验结果表明,在CityPersons数据集上进行训练和验证,相比原算法YOLOv8,ME-YOLO算法的AP_(50)提高了5.6百分点,模型参数量减少了41%,模型大小压缩了40%,在TinyPerson数据集上验证算法的有效性和泛化性,AP_(50)提高了4.1百分点,AP_(50∶95)提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时,有效提高了检测精度,在智慧社区场景中有较好的应用价值。 展开更多
关键词 行人检测 智慧社区 小目标行人 特征金字塔网络 YOLOv8算法
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部