期刊文献+
共找到803篇文章
< 1 2 41 >
每页显示 20 50 100
Multi-scale object detection by top-down and bottom-up feature pyramid network 被引量:14
1
作者 ZHAO Baojun ZHAO Boya +2 位作者 TANG Linbo WANG Wenzheng WU Chen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第1期1-12,共12页
While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection ... While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection of objects with multiple aspect ratios and scales is still a key problem. This paper proposes a top-down and bottom-up feature pyramid network(TDBU-FPN),which combines multi-scale feature representation and anchor generation at multiple aspect ratios. First, in order to build the multi-scale feature map, this paper puts a number of fully convolutional layers after the backbone. Second, to link neighboring feature maps, top-down and bottom-up flows are adopted to introduce context information via top-down flow and supplement suboriginal information via bottom-up flow. The top-down flow refers to the deconvolution procedure, and the bottom-up flow refers to the pooling procedure. Third, the problem of adapting different object aspect ratios is tackled via many anchor shapes with different aspect ratios on each multi-scale feature map. The proposed method is evaluated on the pattern analysis, statistical modeling and computational learning visual object classes(PASCAL VOC)dataset and reaches an accuracy of 79%, which exhibits a 1.8% improvement with a detection speed of 23 fps. 展开更多
关键词 convolutional neural NETWORK (CNN) feature pyramid NETWORK (FPN) object detection deconvolution.
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
2
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks Multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
基于动态自适应通道注意力特征融合的小目标检测 被引量:1
3
作者 吴迪 赵品懿 +2 位作者 甘升隆 沈学军 万琴 《电子科技大学学报》 北大核心 2025年第2期221-232,共12页
针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的... 针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的问题。2)提出一种分组批量动态自适应通道注意力模块,增强弱语义小目标特征同时抑制无用信息,且在动态自适应通道注意力模块中设计新的激活函数和交并比损失函数,提升通道注意力表征能力。3)采用ResNet50作为骨干网络依次连接特征金字塔网络和Tri-Neck网络。实验结果表明,该方法在Pascal Voc 2007、Pascal Voc 2012上比YOLOv8算法mAP分别提升5.3%和6.2%,在MS COCO 2017数据集上AP和AP_S分别提升1.6%和2%,在SODA-D数据集上比YOLOv8算法AP提升0.9%。 展开更多
关键词 小目标检测 多尺度融合特征 特征金字塔 动态通道注意力 交并比损失函数
在线阅读 下载PDF
一种基于元学习的改进YOLO钢管表面缺陷小样本检测模型 被引量:3
4
作者 李凌波 田彦 +1 位作者 江旭东 董宝力 《机电工程》 北大核心 2025年第5期985-993,共9页
针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取... 针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取了特征图的判别能力;然后,为了提高特征融合能力并降低计算复杂度,通过加权双向特征金字塔网络(BiFPN)结构优化了特征提取器的颈部网络,平衡了YOLO-SBN模型的有效性和效率;最后,采用归一化注意力模块(NAM)优化权重调整了模块,增强了浅层缺陷特征的模型表达,并基于这些增强的特征进行了检测;使用金属表面热轧缺陷公开数据集NEU-DET验证了YOLO-SBN模型的算法性能。研究结果表明:对于小样本缺陷检测,YOLO-SBN模型在平均准确率(mAP)方面提高了4.1%;在新类缺陷样本规模数量为50的小样本情况下,改进后的检测模型对新类数据适应性最强。由此可见,该YOLO-SBN模型在提高检测精度和提升模型泛化能力方面具有一定优势。 展开更多
关键词 小样本目标检测 表面缺陷 元学习 特征网络 归一化注意力模块 平均准确率 双向特征金字塔网络(BiFPN)
在线阅读 下载PDF
基于GAN和多尺度空间注意力的多模态医学图像融合 被引量:3
5
作者 林予松 李孟娅 +1 位作者 李英豪 赵哲 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期1-8,共8页
针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图... 针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图像;其次,整个对抗网络框架采用双鉴别器结构,使得生成器生成的融合图像同时保留多个模态图像的显著特征;最后,构建一种多尺度空间注意力作为编码器进行特征提取的基本模块,利用多尺度结构充分捕获并保留源图像的多尺度特征,并且引入空间注意力更好地保留源图像的结构和细节信息。全脑图谱数据库上的实验结果表明:所提算法生成的融合图像不仅纹理细节更为丰富,有助于人类视觉观察,而且在3种不同类型的医学图像融合任务上平均梯度、峰值信噪比、互信息、视觉信息保真度等客观评价指标的平均值分别达到0.3023、20.7207、1.4414、0.6498,与其他先进的算法相比具有一定的优势。 展开更多
关键词 图像融合 多模态医学图像 生成对抗网络 特征金字塔 注意力机制
在线阅读 下载PDF
基于改进YOLOv8的道路交通小目标车辆检测算法 被引量:4
6
作者 火久元 苏泓瑞 +1 位作者 武泽宇 王婷娟 《计算机工程》 北大核心 2025年第1期246-257,共12页
针对交通道路中小目标车辆存在的识别困难、检测精度低以及误检和漏检等问题,提出一种基于YOLOv8算法的大内核、多尺度梯度组合的道路交通小目标车辆检测模型RGGE-YOLOv8。首先,使用RepLayer模型替换YOLOv8网络的主干部分,引入大内核深... 针对交通道路中小目标车辆存在的识别困难、检测精度低以及误检和漏检等问题,提出一种基于YOLOv8算法的大内核、多尺度梯度组合的道路交通小目标车辆检测模型RGGE-YOLOv8。首先,使用RepLayer模型替换YOLOv8网络的主干部分,引入大内核深度可分离卷积结构,拓展上下文信息,以增强模型对小目标的信息捕获能力;其次,使用GIoU代替原损失函数,解决IoU在预测框与真实框没有重叠时存在的无法优化问题;然后,引入全局注意力机制(GAM),通过减少信息丢失并增强全局交互信息来提高网络的特征表达能力;最后,引入CSPNet并重参化梯度组合特征金字塔,使得模型具有较大感受野和高形状偏差。实验结果表明,RGGE-YOLOv8在Visdrone数据集和自有数据集上mAP@0.5指标分别达到34.8%和94.7%,相较于原始YOLOv8n算法精度分别提高了2.2和5.51百分点,证明了RGGE-YOLOv8模型对道路小目标车辆检测的有效性。 展开更多
关键词 YOLOv8 小目标检测 深度学习 多尺度特征金字塔 注意力机制
在线阅读 下载PDF
基于改进YOLOv5的密集行人检测算法 被引量:3
7
作者 胡倩 皮建勇 +2 位作者 胡伟超 黄昆 王娟敏 《计算机工程》 北大核心 2025年第3期216-228,共13页
针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨... 针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积,有效缓解特征信息丢失的问题;其次,针对非相邻特征图不直接融合从而引起特征融合率较低的问题,提出新的双层渐进金字塔网络(DAFPN),提高行人检测的准确性和精度;最后,基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数,以调整和提高帧回归率,促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型,mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点;引入EfficiCIoU_Loss后,模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展,提高了其在实际应用中的性能和效率。 展开更多
关键词 密集行人检测 小目标行人检测 Conv-SPD网络 双层渐进特征金字塔网络 EfficiCIoU_Loss损失函数
在线阅读 下载PDF
多尺度和多层级特征融合的人体姿态估计 被引量:2
8
作者 王燕妮 胡敏 +2 位作者 韩世鹏 陈艺瑄 吕昊 《计算机工程与应用》 北大核心 2025年第6期199-209,共11页
人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(m... 人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(multi-scale and multi-level network,MSLNet)。采用高分辨率网络(high-resolution network,HRNet)作为主干,通过跨尺度信息交互,实现不同分辨率特征图之间的信息交换,获取同时包含细粒度和粗粒度的姿态特征;引入期望最大化注意力-加权双向特征金字塔网络(expectation maximization attention-bidirectional feature pyramid network,EMA-BiFPN),实现多尺度特征融合后的多层级特征聚合,从局部到全局捕捉人体姿态的细节和关联信息;设计由残差结构组成的关键点检测头,完成输出特征的最终融合并提升人体关键点检测准确率。实验结果表明,MSLNet在COCO和MPII数据集上分别取得了75.8%和91.1%的准确率,实现了最优精度,充分验证了MSLNet能够融合尺度和层级之间的互补特征,进而提升人体姿态估计精度。 展开更多
关键词 高分辨率网络(HRNet) 人体姿态估计 期望最大化注意力 双向特征金字塔网络 特征融合
在线阅读 下载PDF
基于卷积神经网络的线结构光高精度三维测量方法 被引量:1
9
作者 叶涛 何威燃 +2 位作者 刘国鹏 欧阳煜 王斌 《仪器仪表学报》 北大核心 2025年第2期183-195,共13页
线结构光视觉三维测量技术因其高精度和非接触的三维重建优势而被广泛应用。然而,现有的线结构光三维测量方法在标定过程中往往面临较高的耦合性问题,且在复杂环境下,背景噪声和光照变化会严重干扰条纹的提取,导致结构光条纹中心定位精... 线结构光视觉三维测量技术因其高精度和非接触的三维重建优势而被广泛应用。然而,现有的线结构光三维测量方法在标定过程中往往面临较高的耦合性问题,且在复杂环境下,背景噪声和光照变化会严重干扰条纹的提取,导致结构光条纹中心定位精度下降,进而影响整体三维测量的精度和鲁棒性。针对上述问题,提出了一种基于卷积神经网络的鲁棒三维测量方法。首先,设计了一种创新性的残差U型块特征金字塔网络(RSU-FPN),旨在实现背景噪声的干扰抑制和结构光条纹区域中心的高精度鲁棒提取。其次,构建了一种新型的线结构光视觉传感器,并提出了一种分离式测量模型,成功将摄像机标定与光平面标定解耦,极大地提高了系统的灵活性与扩展性。通过这种解耦的标定方式,避免了传统标定方法中存在的耦合问题,使得整个测量系统更加高效且易于调整。实验结果表明,所提出的基于卷积神经网络的鲁棒三维测量方法,在复杂背景下能够实现结构光条纹中心的高精度提取,利用提取出的光条纹中心进行标定,其均方根误差分别为x方向0.005 mm、y方向0.009 mm以及z方向0.097 mm。并且,该方法在不同表面类型(如漫反射表面和光滑反射表面)上均能实现高精度的三维重建,验证了其在实际应用中的优越性和强大的鲁棒性。 展开更多
关键词 线结构光 三维测量 卷积神经网络 残差U型块特征金字塔网络 背景噪声抑制
在线阅读 下载PDF
基于改进YOLOv8的路面病害检测模型
10
作者 侯勇严 梁扩旺 +3 位作者 郭文强 郝磊 郭志高 董白杨 《陕西科技大学学报》 北大核心 2025年第3期166-173,共8页
针对现有路面病害检测模型存在特征提取能力弱、特征融合能力不足、未能有效平衡检测精度与轻量化等问题,提出了一种利用通道先验卷积注意力(CPCA)机制和双向特征金字塔网络(BiFPN)改进YOLOv8的路面病害检测模型--YOLOv8n-CB.在YOLOv8n... 针对现有路面病害检测模型存在特征提取能力弱、特征融合能力不足、未能有效平衡检测精度与轻量化等问题,提出了一种利用通道先验卷积注意力(CPCA)机制和双向特征金字塔网络(BiFPN)改进YOLOv8的路面病害检测模型--YOLOv8n-CB.在YOLOv8n的主干网络引入CPCA机制,动态调整通道和空间维度上的注意力权重,增强对小目标的特征提取能力,提高模型的检测精度;其次,将颈部网络替换为加权BiFPN,通过新增加权跳跃连接机制,在实现模型轻量化的同时,提高对小目标的特征融合能力.在China_Mix路面病害数据集上的实验结果表明,改进后的模型mAP@0.5、mAP@[0.5-0.9]与原始模型相比可分别提升1%与2.90%,F1-score提升2%,并且参数量降低29.33%,浮点数运算次数也降低了9.88%.通过与其他YOLO模型的实验对比,本模型的有效性和优越性得到了进一步的验证,为公路综合运输安全风险防控智能化提供了技术支持. 展开更多
关键词 路面病害 YOLO 注意力机制 双向特征金字塔
在线阅读 下载PDF
具备红外感知的低光场景目标检测
11
作者 张志佳 那惺奇 +2 位作者 肖宇航 房建 赵怀慈 《沈阳工业大学学报》 北大核心 2025年第4期417-424,共8页
【目的】随着人工智能领域的快速发展,基于可见光图像的目标检测技术日益成熟,并在自动驾驶、安防监控、智能交通等领域得到了广泛应用。然而,在低光场景(如黑夜或昏暗灯光环境)下,基于可见光图像的目标检测算法性能显著下降。主要原因... 【目的】随着人工智能领域的快速发展,基于可见光图像的目标检测技术日益成熟,并在自动驾驶、安防监控、智能交通等领域得到了广泛应用。然而,在低光场景(如黑夜或昏暗灯光环境)下,基于可见光图像的目标检测算法性能显著下降。主要原因在于可见光图像在低光条件下信息丢失严重,导致目标特征难以提取。为解决这一问题,提出了基于可见光图像和红外图像的多模态目标检测技术,该技术能够有效改善低光场景下的目标检测性能。然而,多模态检测技术的成本较高,需要对不同模态的图像进行精确配准,计算量较大,从而增加了实现难度和处理负担。基于此,提出了一种具备红外感知的目标检测网络(InSCnet),旨在通过一个可见光相机来预测红外热辐射特征,在不增加模态的情况下提升网络在低光场景下的目标检测能力。【方法】InSCnet以可见光图像为输入,通过红外预测分支(IPB)生成红外图像来预测热辐射特征,从而增强网络对低光场景的感知能力。为了有效融合多尺度视觉和热辐射特征,设计了互补融合滤波(COFF)模块。COFF通过互补融合这两种特征,增强特征间的互补性,避免了网络对单一模态特征的过度依赖。此外,采用混合特征金字塔(HyFP)模块,通过特征金字塔和注意力机制,进一步提升多尺度全局与局部特征的融合与提取能力,确保网络在不同程度的低光条件下均能保持较高的检测准确率。【结果】实验结果表明,InSCnet在LLVIP行人检测数据集上表现优异。具体而言,S mAP50达到了0.830,S mAP50-95达到了0.426。同时在DroneVehicle数据集上进行了实验,S mAP50达到了0.702,证明了InSCnet具备多类别低光检测能力。【结论】InSCnet通过引入红外热辐射特征和特征融合机制,提升了低光场景下的目标检测性能;在低光场景下能够有效检测可见光图像中难以识别的目标,为低光场景下的目标检测提供了一种有效的解决方案。未来的研究可以进一步探索如何优化网络结构。 展开更多
关键词 目标检测 低光场景 红外预测 特征融合 特征金字塔 全局特征 局部特征 人工智能
在线阅读 下载PDF
基于坐标注意力和加权双向特征金字塔网络的舰载机阻拦着舰拉制状态精准识别
12
作者 李哲 杨杰 +4 位作者 张椅 王华 李亚飞 王可 徐明亮 《中国舰船研究》 北大核心 2025年第4期124-133,共10页
[目的]舰载机着舰安全的关键在于尾钩与阻拦索成功挂索,而现有研究中,借助智能化手段辅助着舰指挥官(LSO)识别阻拦着舰状态的工作较少。为此,提出一种融合坐标注意力和加权双向特征金字塔网络的阻拦着舰拉制状态识别模型。[方法]先使用... [目的]舰载机着舰安全的关键在于尾钩与阻拦索成功挂索,而现有研究中,借助智能化手段辅助着舰指挥官(LSO)识别阻拦着舰状态的工作较少。为此,提出一种融合坐标注意力和加权双向特征金字塔网络的阻拦着舰拉制状态识别模型。[方法]先使用坐标注意力机制(CA)从空间和通道两个维度增强模型捕捉特征的能力;再通过加权双向特征金字塔网络(BiFPN)纳入可学习的权值学习不同输入特征的重要性,实现双向多尺度特征融合;然后采用C2F模块轻量化模型架构,减少参数和计算量;最后通过仿真实验将所提模型与5种基线模型进行对比。[结果]结果表明,在舰载机尾钩和阻拦着舰拉制状态的检测上,该模型综合性能均优于基线模型。[结论]该模型有助于提高尾钩及阻拦索的啮合状态检测的准确率和鲁棒性,对提高舰载机着舰作业的效率、预防潜在的人员伤害和装备损失具有重要意义。 展开更多
关键词 舰载机 阻拦装置 状态识别 双向特征金字塔网络(BiFPN) 航空母舰
在线阅读 下载PDF
基于改进RT-DETR的织物疵点检测方法
13
作者 李敏 周双 +2 位作者 朱萍 崔树芹 颜小运 《电子测量技术》 北大核心 2025年第14期176-184,共9页
针对织物疵点种类有限、尺度变化大以及模型检测精度低等问题,提出了一种基于RT-DETR的织物疵点检测方法DHR-DETR。首先,创新性地设计了多路径坐标注意力机制模块(MPCA),并将其与可变形卷积模块(DCNv2)深度融合,构建动态可变形卷积模块... 针对织物疵点种类有限、尺度变化大以及模型检测精度低等问题,提出了一种基于RT-DETR的织物疵点检测方法DHR-DETR。首先,创新性地设计了多路径坐标注意力机制模块(MPCA),并将其与可变形卷积模块(DCNv2)深度融合,构建动态可变形卷积模块,以应对复杂多样的疵点形状。其次,采用高水平筛选特征金字塔(HS-FPN)替换跨尺度特征融合模块(CCFM),实现多层次特征的高效融合并有效降低了模型复杂度。最后,构建了兼具轻量化和特征增强能力的RetBlockC3模块,并集成至HS-FPN网络,进一步强化模型对局部信息的捕捉能力,同时显著提升模型的轻量化性能。试验结果表明,DHR-DETR方法在公开和自制织物数据集上的mAP@0.5分别达到了50.9%和97.5%,相较原模型提高了2.9%和0.6%,参数量仅为17.9 M,计算量降低了37%,显著提升了模型的检测性能和部署效率,具备在实际工业检测任务中的应用潜力。 展开更多
关键词 RT-DETR 疵点检测 动态可变形卷积 高水平筛选特征金字塔 轻量化
在线阅读 下载PDF
基于多尺度渐近金字塔的太阳电池缺陷检测网络
14
作者 朱磊 耿萃萃 +3 位作者 李博涛 潘杨 张博 姚丽娜 《太阳能学报》 北大核心 2025年第5期267-274,共8页
以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关... 以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关注重点区域的同时减少参数量的引入;最后提出一种改进渐近金字塔网络AFPNa结构,缓解网络在特征融合过程中信息的丢失或退化问题,提升缺陷检测精度。实验结果表明,与YOLOv8原模型及RTMDET等7种先进检测网络相比,MSANet具有更高的检测精度,相较原模型均值平均精度提升5.7个百分点。 展开更多
关键词 缺陷检测 深度学习 太阳电池 分层特征融合结构 多尺度渐近金字塔 空间注意力机制
在线阅读 下载PDF
融合多尺度特征和多重注意力的棉田杂草检测研究
15
作者 帖军 龙吕佳 +2 位作者 郑禄 刘娇 巴桑顿珠 《中国农机化学报》 北大核心 2025年第10期138-145,共8页
针对现有棉田杂草检测方法识别杂草类别少、精度低的问题,提出一种融合多尺度特征和多重注意力的棉田杂草检测方法。首先,在骨干网络中引入高效多尺度注意力模块提升模型的特征提取能力,同时不增加模型参数量与计算量;其次,在头部网络... 针对现有棉田杂草检测方法识别杂草类别少、精度低的问题,提出一种融合多尺度特征和多重注意力的棉田杂草检测方法。首先,在骨干网络中引入高效多尺度注意力模块提升模型的特征提取能力,同时不增加模型参数量与计算量;其次,在头部网络添加渐进特征金字塔,进一步增强特征融合效果;最后,通过改进框回归损失函数提升模型的收敛速度和定位精度。在CottonWeedDet12数据集上进行试验,结果表明,该方法检测平均精度均值mAP达到94.6%,F1分数为0.754。相比于原始模型,mAP提高2.62%,召回率提高3.16%,同时检测时间为65.359 ms,满足实时检测的要求。该方法能够很好地解决自然环境下棉田杂草的精确检测问题,为棉田智能除草设备的研究提供参考。 展开更多
关键词 棉田 杂草检测 YOLOv8算法 注意力机制 特征金字塔
在线阅读 下载PDF
面向复杂背景环境下垃圾检测的YOLOv8n轻量化改进
16
作者 孙世政 何玲玲 +2 位作者 郑帅 徐向阳 陈仁祥 《电子测量与仪器学报》 北大核心 2025年第2期136-146,共11页
垃圾检测与分类对推动绿色经济和实现低碳循环具有重要意义,面向复杂背景环境的垃圾检测模型存在参数量大、计算成本高等问题,限制了模型在资源受限设备上的应用。为解决上述问题,提出一种轻量化的GCAW-YOLOv8n模型,旨在平衡模型轻量化... 垃圾检测与分类对推动绿色经济和实现低碳循环具有重要意义,面向复杂背景环境的垃圾检测模型存在参数量大、计算成本高等问题,限制了模型在资源受限设备上的应用。为解决上述问题,提出一种轻量化的GCAW-YOLOv8n模型,旨在平衡模型轻量化与精度检测。首先,在YOLOv8n骨干网络中引入GhostNet网络中的C3Ghost和GhostConv模块,有效降低模型参数量;其次,添加上下文锚点注意力机制,增强特征提取能力,提升检测精度;然后,在特征融合阶段,构建渐近特征金字塔网络,提升多尺度目标检测能力;接着,采用WIoU v3边界损失函数优化网络边界框回归性能;最后,结合Taco数据集和人工采集数据集进行了模型验证实验。实验结果表明,相比原YOLOv8n模型,改进后的GCAW-YOLOv8n模型在模型参数量Params和计算量FLOPs分别降低了14.3%和33.3%,而精确度和召回率分别提高了4.4%和1.9%,同时mAP@0.5达到了81.3%,提升了0.7%。改进模型更好地平衡了模型轻量化和检测精度,对模型部署与应用至边缘端检测装备具有重要的工程意义。 展开更多
关键词 垃圾检测 轻量化YOLOv8n GhostNet 上下文锚点注意力机制 渐近特征金字塔
在线阅读 下载PDF
基于DSG-ResNet34的聚乙烯燃气管道电熔焊接缺陷检测
17
作者 凌晓 刘露 +2 位作者 孙宝财 张正棠 徐晓刚 《仪器仪表学报》 北大核心 2025年第6期228-240,共13页
PE燃气管道的连接质量能直接影响中低压燃气的正常输送,在电熔焊接时产生的结构畸变、冷焊等缺陷会显著削弱管道的力学性能,威胁燃气管网的稳定运行。因此,基于实地采集的PE燃气管道电熔焊接缺陷DR图像数据集,提出了基于DSG-ResNet34模... PE燃气管道的连接质量能直接影响中低压燃气的正常输送,在电熔焊接时产生的结构畸变、冷焊等缺陷会显著削弱管道的力学性能,威胁燃气管网的稳定运行。因此,基于实地采集的PE燃气管道电熔焊接缺陷DR图像数据集,提出了基于DSG-ResNet34模型的缺陷检测方法,以实现对电熔焊接缺陷进行快速精准地检测。该网络模型由主干网络CBAM-ResNet34模块、动态稀疏门控金字塔DSG-FPN、多尺度检测头3个部分组成,首先通过主干网络CBAM-ResNet34结构从通道和空间两个维度提升网络模型对缺陷特征的关注度,然后通过动态稀疏门控金字塔DSG-FPN结构的动态稀疏门控模块、Inception模块、稀疏连接动态融合多尺度缺陷特征,有效保留小目标特征、抑制背景噪声,最后通过多尺度检测头结构将提取到的丰富特征转化为具体的检测结果。DSG-ResNet34模型的缺陷检测准确率最高可达95.5%、P2层精确率最高可达82.7%、小目标召回率最低为85.6%、检测速度可达68 fps、参数量为22.3×10^(6),该模型能快速定位识别孔洞、熔融面夹杂、结构畸变、冷焊这4类典型电熔焊接缺陷,检测性能与速度优于其他网络模型。为PE管道焊接质量智能化检测提供了高精度解决方案,对保障燃气管网安全运行具有重要意义。 展开更多
关键词 聚乙烯燃气管道 缺陷检测 电熔焊接 ResNet34模型 特征金字塔
在线阅读 下载PDF
一种基于轻量化卷积模块的语义分割网络
18
作者 连晓峰 康毛毛 +1 位作者 谭励 王艳莉 《应用科学学报》 北大核心 2025年第1期66-79,共14页
融合深度学习的语义同步定位与地图构建技术为处理动态场景提供了有效的解决方案,但仍面临计算资源消耗大和模型复杂度高的挑战。为此,提出了一种基于BlendMask改进的轻量化语义分割网络。首先,设计了一种轻量的GDS-ECA卷积(Ghost-depth... 融合深度学习的语义同步定位与地图构建技术为处理动态场景提供了有效的解决方案,但仍面临计算资源消耗大和模型复杂度高的挑战。为此,提出了一种基于BlendMask改进的轻量化语义分割网络。首先,设计了一种轻量的GDS-ECA卷积(Ghost-depthwise separable convolution with efficient channel attention)模块,利用深度可分离卷积替代Ghost卷积中的少量卷积操作,减少参数量和计算量,并添加注意力机制提升特征表达能力。其次,提出了特征提取网络BGTNet(bottleneck GDS-ECA attention transformer network),将GDS-ECA卷积应用于颈部模块的卷积层以提升网络的提取精度;此外,将特征金字塔网络(feature pyramid network,FPN)中的传统卷积替换为GDS-ECA卷积,构建轻量化特征金字塔网络,并结合BGTNet形成语义分割网络的主干网。最后在数据集COCO上进行了实验验证,改进后的模型处理图像时间缩短了7.3 ms,平均精度提升了1.5%。 展开更多
关键词 语义分割 同步定位与地图构建 轻量化 注意力机制 特征金字塔
在线阅读 下载PDF
基于UCTransNet的建筑损害评估模型
19
作者 谢国波 张文亮 +1 位作者 何林 林志毅 《计算机工程与设计》 北大核心 2025年第1期44-51,共8页
为提高建筑损害的评估精度,提出一种基于UCTransNet的双阶段灾后建筑损害评估模型(MGDLNet)。阶段一使用UCTransNet完成建筑分割。阶段二使用改进后的DM-UCTransNet进行建筑损害评估,通过差异特征提取模块充分融合多尺度的建筑损害特征... 为提高建筑损害的评估精度,提出一种基于UCTransNet的双阶段灾后建筑损害评估模型(MGDLNet)。阶段一使用UCTransNet完成建筑分割。阶段二使用改进后的DM-UCTransNet进行建筑损害评估,通过差异特征提取模块充分融合多尺度的建筑损害特征,嵌入空间金字塔更好捕捉小目标建筑及边缘特征,引入深度监督机制和改进损失函数加强浅层特征学习并平衡样本。实验结果表明,MGDLNet在目标数据集有较大优势,其加权F1得分相较于SegNet、UNet、DeeplabV3+、TransUNet和UCTransNet分别提高了8.6%、1.9%、5.0%、2.7%和1.4%。 展开更多
关键词 建筑损害评估 UCTransNet 双阶段 差异特征 空间金字塔 深度监督 损失函数
在线阅读 下载PDF
融合多尺度交叉注意力和边缘感知的伪装目标检测
20
作者 郝子强 张庆宝 +2 位作者 赵世豪 王焯豪 詹伟达 《计算机工程与应用》 北大核心 2025年第10期228-237,共10页
针对当前伪装目标检测算法无法准确、完整地检测出目标对象和其边缘的问题,提出了一种融合多尺度交叉注意力和边缘感知的伪装目标检测网络(multi-scale cross attention and edge perception network,MAEP-Net)。利用Res2Net-50提取图... 针对当前伪装目标检测算法无法准确、完整地检测出目标对象和其边缘的问题,提出了一种融合多尺度交叉注意力和边缘感知的伪装目标检测网络(multi-scale cross attention and edge perception network,MAEP-Net)。利用Res2Net-50提取图像的原始特征,并采用融合了多尺度交叉注意力的特征金字塔结构从通道、空间两个维度挖掘目标位置信息和凸显伪装目标区域特征;使用定位模块对目标的大致位置进行准确定位;边缘感知模块抑制低级特征中背景的噪声,融合边缘特征以获取更多的边缘细节信息;细化模块通过注意力机制分别从前景和背景两个方向关注目标线索,利用边缘先验、语义先验、领域先验、区域先验知识进一步细化目标结构和边缘轮廓。在3个公开数据集上的实验表明,所提算法相较于12种主流算法在4个客观评价指标上均取得了最优表现,尤其是在COD10K数据集上所提算法的加权平均值F-measure和平均绝对误差(mean absolute error,MAE)分别达到0.797和0.031。由此可见,所提算法在COD任务上具有较好的检测效果。 展开更多
关键词 多尺度交叉注意力 边缘感知 伪装目标检测 特征金字塔结构
在线阅读 下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部