期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于平行全维动态注意力机制的视觉地点识别方法
1
作者 刘沛津 刘淑婕 +2 位作者 何林 彭莉峻 付雪峰 《液晶与显示》 CAS CSCD 北大核心 2024年第9期1233-1242,共10页
针对天气、季节、光线等环境变化导致的视觉地点识别鲁棒性低的问题,提出了一种提升视觉地点识别特征描述子环境稳健性的多维度注意力机制——平行全维动态注意力机制(POD-Attention)。为实现卷积核在全维度上的动态精细探索,增强特征... 针对天气、季节、光线等环境变化导致的视觉地点识别鲁棒性低的问题,提出了一种提升视觉地点识别特征描述子环境稳健性的多维度注意力机制——平行全维动态注意力机制(POD-Attention)。为实现卷积核在全维度上的动态精细探索,增强特征提取网络对建筑物等不变性特征的提取与学习能力,采用全维动态卷积块在卷积核全维度(输入输出通道、卷积空间和卷积核数量)上添加互补性注意力。将1×1卷积、Skip Squeeze-and-Excitation(SSE)模块与全维动态卷积块平行融合,不仅有效提高了特征提取速率,还扩大了视觉地点识别网络的感受野,进一步提升了视觉地点的识别准确率。在公开数据集上进行的实验表明,基于VGG16及Patch-NetVLAD特征聚合的视觉地点识别方法经POD注意力机制改进后,在Nordland与Mapillary Street-Level Sequences数据集上的Recall@1指标提升了9.7%与1.8%,充分证明了本文POD注意力机制对于网络性能的提升效果,也证明了基于本文POD注意力机制的视觉地点识别方法的有效性。 展开更多
关键词 视觉地点识别 环境鲁棒性 深度学习 平行全维动态注意力机制 平行策略
在线阅读 下载PDF
融合多种注意力机制和Wise-IoUv3的水下目标检测算法
2
作者 肖振久 高凯歌 李士博 《广东海洋大学学报》 北大核心 2025年第2期109-117,共9页
【目的】针对水下目标图像存在成像模糊和复杂背景下检测精度低的问题,提出融合多种注意力机制和Wise-IoUv3的水下目标检测算法。【方法】首先,设计多尺度特征增强机制,在主干网络部分采用全维动态卷积(ODConv)替代部分卷积并引入高效... 【目的】针对水下目标图像存在成像模糊和复杂背景下检测精度低的问题,提出融合多种注意力机制和Wise-IoUv3的水下目标检测算法。【方法】首先,设计多尺度特征增强机制,在主干网络部分采用全维动态卷积(ODConv)替代部分卷积并引入高效的多尺度注意力机制(EMA),提升主干网络对模糊目标和小目标特征提取能力。其次,改进快速空间金字塔池化(SPPF)模块,增加平均池化分支补充空间信息,提升全局上下文感知能力并在两个分支融入轻量级BiFormer注意力机制,降低模型计算复杂度,增强对小目标检测性能。然后,在预测阶段,用Wise-IoUv3代替原损失函数,平衡不同质量图像模型训练结果。最后,用动态检测头(DynamicHead)替代原检测头,增强检测头的尺度感知、空间感知和任务感知能力,提高对象位置的识别准确性。【结果与结论】在RUOD和URPC数据集上实验结果表明,模型的检测精度、参数量和计算量较目前其他的主流模型表现良好,特别是与YOLOv8n算法相比,改进后算法在平均精度均值上提升3.6%和1.7%,尤其在包含大量小目标的类别(如海胆、扇贝)中表现更优;模型的参数量和计算量分别减少了0.26×10^(6)和0.4 GFLOPs。实验结果表明,该方法减少了在复杂情况下模糊目标和小目标漏检和误检情况,提高了检测性能,同时保持了模型的轻量性。 展开更多
关键词 水下目标检测 多尺度特征增强机制 多尺度注意力机制 全维动态卷积 Wise-IoUv3
在线阅读 下载PDF
YOLO-POD:基于多维注意力机制的高精度PCB微小缺陷检测算法 被引量:2
3
作者 郭艳 王智文 赵润星 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2515-2528,共14页
随着电子设备的广泛应用,印刷电路板(Printed Circuit Board,PCB)在电子制造行业中具有重要意义.然而,由于制造过程中的不完美和环境因素的干扰,PCB上可能存在微小的缺陷.因此,开发高效准确的缺陷检测算法对于确保产品质量至关重要.针对... 随着电子设备的广泛应用,印刷电路板(Printed Circuit Board,PCB)在电子制造行业中具有重要意义.然而,由于制造过程中的不完美和环境因素的干扰,PCB上可能存在微小的缺陷.因此,开发高效准确的缺陷检测算法对于确保产品质量至关重要.针对PCB微小缺陷检测问题,本文提出了一种基于多维注意力机制的高精度PCB微小缺陷检测算法.为降低网络的模型参数量和计算量,引入部分卷积(Partial Convolution,PConv),将ELAN(Efficient Layer Aggregation Network)模块设计为更加高效的P-ELAN,同时,为增强网络对微小缺陷的特征提取能力,引入多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM)的全维动态卷积(Omni-dimensional Dynamic Convolution,ODConv)并结合部分卷积,设计了POD-CSP(Partial ODconv-Cross Stage Partial)和POD-MP(Partial ODconv-Max Pooling)跨阶段部分网络模块,提出了OD-Neck结构.最后,本文基于(Youo Only Look Once version 7,YOLOv7)提出了对小目标更加高效的YOLO-POD模型,并在训练阶段采用一种新颖的Alpha-SIoU损失函数对网络进行优化.实验结果表明,YOLO-POD的检测精确率和召回率分别达到了98.31%和97.09%,并在多个指标上取得了领先优势,尤其是对于更严格的(mean Average Precision at IoU threshold of 0.75,mAP75)指标,比原始的YOLOv7模型提高28%.验证了YOLO-POD在PCB缺陷检测性能中具有较高的准确性和鲁棒性,满足高精度的检测要求,可为PCB制造行业提供有效的检测解决方案. 展开更多
关键词 印刷电路板 小目标缺陷检测 POD-CSP POD-MP 全维动态卷积 多维注意力机制
在线阅读 下载PDF
基于YOLOv8改进的跌倒检测算法:OEF-YOLO
4
作者 宋杰 徐慧英 +3 位作者 朱信忠 黄晓 陈晨 王泽宇 《计算机工程》 北大核心 2025年第7期127-139,共13页
在室内场景下,受角度、光线变化等因素的影响,导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此,提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块,优化了核空间的... 在室内场景下,受角度、光线变化等因素的影响,导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此,提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块,优化了核空间的4个维度以增强特征提取能力,而且有效减少了计算负担。同时,为了捕获更细粒度的特征,在颈部网络中引入高效多尺度注意力(EMA)模块,进一步聚合像素级特征,提高网络在跌倒场景中的处理能力。在CIoU损失函数中融入Focal Loss思想,使模型对难分类样本给予更多关注,优化模型整体性能。实验结果表明,相比YOLOv8n,OEF-YOLO跌倒检测算法在mAP@0.5指标上提升了1.5百分点,mAP@0.5∶0.95提升1.4百分点,参数量和计算量分别为3.1×10^(6)和6.5 GFLOPs,在图形处理器(GPU)上FPS提高了44,在提高精度检测跌倒事件的同时,兼顾了低算力场景下的部署要求。 展开更多
关键词 目标检测 轻量化 跌倒事件 注意力机制 全维动态卷积
在线阅读 下载PDF
可在TFT-LCD面板中实现多背景视觉细微缺陷检测的YOLO-DSM方法
5
作者 孔祥飞 王森 +1 位作者 赵林 陈明方 《中山大学学报(自然科学版)(中英文)》 北大核心 2025年第2期129-137,共9页
提出了一种基于YOLO-DSM深度学习图像检测模型。首先,在每个Dark模块后引入HMU模块,以提高TFT-LCD面板上目标缺陷的检测精度。将原始SPP替换为SSMA,使得网络更加关注背景低对比度目标。其次,引入DSM模块以帮助网络增强有用特征且抑制无... 提出了一种基于YOLO-DSM深度学习图像检测模型。首先,在每个Dark模块后引入HMU模块,以提高TFT-LCD面板上目标缺陷的检测精度。将原始SPP替换为SSMA,使得网络更加关注背景低对比度目标。其次,引入DSM模块以帮助网络增强有用特征且抑制无用特征,增强语义信息的集成。最后,用ODConv模块替换原始网络的下采样卷积,细化局部特征映射,实现局部缺陷特征的充分提取。在自制的TFT-LCD缺陷数据集中,与当前较为先进的算法进行对比。结果表明,YOLO-DSM网络在mAP精度方面达到了97.40%,且FPS达到了77.42帧,可满足TFT-LCD缺陷任务检测要求。 展开更多
关键词 视觉细微缺陷 YOLO-DSM 全维动态卷积 SCSE注意力机制
在线阅读 下载PDF
基于改进YOLOv7的煤矿井下低质影像安全帽检测
6
作者 康程洋 张延军 张睿 《科学技术与工程》 北大核心 2025年第20期8595-8603,共9页
由于井下环境复杂,低光照以及安全帽的物体较小导致的检测效果不理想。针对复杂环境下的低质影像,提出一种改进YOLOv7的煤矿井下低质影像安全帽检测。首先,针对低光照条件下的图像特征易受噪声干扰的局限性,提出多尺度MELAN模块,通过构... 由于井下环境复杂,低光照以及安全帽的物体较小导致的检测效果不理想。针对复杂环境下的低质影像,提出一种改进YOLOv7的煤矿井下低质影像安全帽检测。首先,针对低光照条件下的图像特征易受噪声干扰的局限性,提出多尺度MELAN模块,通过构建多尺度注意力机制来捕捉更广泛的上下文信息,进而强化特征信息的提取,并有效抑制噪声的干扰;其次,在主干网络使用软池化和全维动态卷积构建OD-SMP模块,减少了特征映射中的信息弥散,保留了更多上下文信息,增强对小目标的检测能力;最后,对于煤矿井下不同光照和距离的复杂背景和环境,导致检测样本质量出现参差不齐的情况,使用Wise-IoU作为损失函数。实验结果表明:改进模型的平均精度为94.9%,比原来的YOLOv7模型高出13.5%,具有更好的检测效果。 展开更多
关键词 低光照 多尺度 全维动态卷积 注意力机制 损失函数
在线阅读 下载PDF
基于改进YOLOv10的盒装食品生产线包装缺陷检测方法
7
作者 王静蕾 赵英杰 +1 位作者 李峰 王春雨 《食品与机械》 北大核心 2025年第4期236-241,共6页
[目的]解决传统食品生产中包装缺陷检测方法存在的检测精度低和实时性差等问题。[方法]在分析食品自动化生产线的基础上,应用改进的YOLOv10模型作为盒装食品生产线包装缺陷检测方法。在骨干层和颈部层的C2f模块后引入注意力机制CBAM,以... [目的]解决传统食品生产中包装缺陷检测方法存在的检测精度低和实时性差等问题。[方法]在分析食品自动化生产线的基础上,应用改进的YOLOv10模型作为盒装食品生产线包装缺陷检测方法。在骨干层和颈部层的C2f模块后引入注意力机制CBAM,以增强模型在复杂背景中的特征目标定位能力。在骨干层和颈部层引入全维动态卷积,以减少计算冗余,提高检测精度。在头部层引入P2并去除P5,以提高小目标检测性能。在头部层优化损失函数,以提高模型收敛性能。[结果]试验方法有效提高了盒装食品包装缺陷的检验精度,满足实时性要求,检测准确率>98.00%,检测平均时间<0.02 s。[结论]深入学习与机器视觉相结合可以实现盒装食品包装缺陷的快速准确检测。 展开更多
关键词 食品生产 包装缺陷 YOLOv10模型 注意力机制CBAM 全维动态卷积
在线阅读 下载PDF
深度学习的红外热成像电路板元器件识别研究 被引量:1
8
作者 张林鍹 郑兴 +3 位作者 陈飞 李名洪 邱朝洁 常乾坤 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第4期560-567,共8页
针对现有YOLO目标检测算法在自建数据集漏检率高、图像受复杂环境影响造成检测准确率低等问题,提出一种基于YOLO v5改进的红外图像识别算法。根据红外数据图片的独特性质,重新设计主干网络部分,引入全维动态卷积(OMNI-Dimensional Dynam... 针对现有YOLO目标检测算法在自建数据集漏检率高、图像受复杂环境影响造成检测准确率低等问题,提出一种基于YOLO v5改进的红外图像识别算法。根据红外数据图片的独特性质,重新设计主干网络部分,引入全维动态卷积(OMNI-Dimensional Dynamic Convolution, ODConv)模块和改进坐标注意力(Coordinate Attention, CA)机制,提高模型对小目标的检测精确度并减少参数量;其次,引入解耦头(Decoupled Head, DH)模块,提高模型训练的收敛速度;最后,加入GSConv(Graph-Shifted Convolution) Slim模块,以降低模型的复杂度,提高预测速度。实验结果表明:改进后的算法模型漏检率降低40.22%,每秒浮点运算次数(Floating-point Operations Per Second, FLOPs)提升了25%,平均准确率提升了28.32%。 展开更多
关键词 红外热成像 YOLO v5 全维动态卷积 改进解耦头 改进坐标注意力机制 GSConv Slim模块
在线阅读 下载PDF
基于改进DPGN的少样本图像分类算法研究 被引量:1
9
作者 王玲 孙莹 +1 位作者 王鹏 白燕娥 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第2期161-169,共9页
DPGN(distribution propagation graph network)是基于深度学习的少样本图像分类算法,在数据稀疏的条件下可以顺利完成图像分类,但其分类的准确率仍需进一步提升。以DPGN算法为研究对象,提出SFOD_DPGN(SinAM_FRN_layer_ODConv_DM&EM... DPGN(distribution propagation graph network)是基于深度学习的少样本图像分类算法,在数据稀疏的条件下可以顺利完成图像分类,但其分类的准确率仍需进一步提升。以DPGN算法为研究对象,提出SFOD_DPGN(SinAM_FRN_layer_ODConv_DM&EMD_distribution propagation graph network)算法。在骨干神经网络Resnet12的残差块中融入注意力机制;将Resnet12网络中批量归一化与ReLu激活函数搭配使用的方式改为滤波器响应归一化与阈值线性单元激活函数搭配使用的方式;在分类器模块中选用全维动态卷积替换普通卷积;使用马氏距离和推土机距离替换L2距离度量函数。在CUB-200-2011数据集上的实验表明,在5way-1shot和5way-5shot分类任务下,SFOD_DPGN算法比DPGN算法的准确率提升约7.97%和2.66%。 展开更多
关键词 深度学习 少样本图像分类 注意力机制 全维动态卷积 马氏距离 推土机距离
在线阅读 下载PDF
PAW-YOLOv7:河道微小漂浮物检测算法 被引量:2
10
作者 栾庆磊 常昕昱 +3 位作者 吴叶 邓从龙 史艳琼 陈梓华 《光电工程》 CAS CSCD 北大核心 2024年第4期101-113,共13页
河道漂浮物检测对于船舶自动驾驶以及河道清理有着重大意义,但现有的方法在针对河道漂浮物目标尺寸小且互相遮挡、特征信息少时出现检测精度低等问题。为解决这些问题,本文基于YOLOv7,提出了一种改进模型PAWYOLOv7。首先,为了提高网络... 河道漂浮物检测对于船舶自动驾驶以及河道清理有着重大意义,但现有的方法在针对河道漂浮物目标尺寸小且互相遮挡、特征信息少时出现检测精度低等问题。为解决这些问题,本文基于YOLOv7,提出了一种改进模型PAWYOLOv7。首先,为了提高网络模型对小目标的特征表达能力,构建了小目标物体检测层,并将自注意力和卷积混合模块(ACmix)集成应用于新构建的小目标检测层;其次,为了减少复杂背景的干扰,采用全维动态卷积(ODConv)代替颈部的卷积模块,使网络具有捕获全局上下文信息能力;最后,将PConv(partial convolution)模块融入主干网络,替换部分标准卷积,同时采用WIoU(Wise-IoU)损失函数取代CIoU,实现网络模型计算量的降低,提高网络检测速度,同时增加对低质量锚框的聚焦能力,加快模型收敛速度。实验结果表明,PAW-YOLOv7算法在本文利用数据扩展技术改进的FloW-Img数据集上的检测精度达到89.7%,较原YOLOv7提升了9.8%,且检测速度达到54帧/秒(FPS),在自建的稀疏漂浮物数据集上的检测精度比YOLOv7提高了3.7%,能快速准确地检测河道微小漂浮物,同时也具有较好的实时检测性能。 展开更多
关键词 YOLOv7 漂浮物检测 混合卷积自注意力机制 全维动态卷积 Wise-IoU损失函数
在线阅读 下载PDF
基于改进YOLOv7的交通路口目标识别算法
11
作者 江晟 张仲义 +1 位作者 汪宗洋 于晴 《吉林大学学报(理学版)》 CAS 北大核心 2024年第3期665-673,共9页
针对交通路口车辆目标检测算法存在精确度低、少检、漏检等问题,提出一种基于改进YOLOv7的交通路口目标识别算法.该算法首先利用前馈式卷积注意力机制CBAM从通道注意力和空间注意力两者提升网络对关键特征的注意力,提高网络的运行速率,... 针对交通路口车辆目标检测算法存在精确度低、少检、漏检等问题,提出一种基于改进YOLOv7的交通路口目标识别算法.该算法首先利用前馈式卷积注意力机制CBAM从通道注意力和空间注意力两者提升网络对关键特征的注意力,提高网络的运行速率,优化网络的特征提取能力;其次采取空间层到深度层连接全维动态卷积组成一个新的学习模块,以此结构改进YOLOv7特征学习方式,提升特征表达能力;最后在实际采集的交通路口数据集上进行实验.实验结果表明,该方法在对应数据集上平均精度达到96.1%,训练耗时降低至16.71 h,因此针对交通路口小目标检测有明显的识别优势. 展开更多
关键词 深度学习 目标检测 卷积神经网络 注意力机制 全维动态卷积
在线阅读 下载PDF
基于超小波变换与OD−ConvNeXt−ELA的矿用滚动轴承故障诊断
12
作者 吴新忠 罗康 +2 位作者 唐守锋 何泽旭 陈琪 《工矿自动化》 CSCD 北大核心 2024年第12期120-127,共8页
针对现有矿用滚动轴承故障诊断方法存在特征提取能力有限、泛化性欠佳的问题,提出了一种基于超小波变换(SLT)与OD−ConvNeXt−ELA的矿用滚动轴承故障诊断方法。以ConvNeXt−T为基础,引入批归一化(BN)技术以提高网络的泛化性,使用全维动态卷... 针对现有矿用滚动轴承故障诊断方法存在特征提取能力有限、泛化性欠佳的问题,提出了一种基于超小波变换(SLT)与OD−ConvNeXt−ELA的矿用滚动轴承故障诊断方法。以ConvNeXt−T为基础,引入批归一化(BN)技术以提高网络的泛化性,使用全维动态卷积(ODConv)替换原有的深度可分离卷积,以提高网络的适应性,引入高效局部注意力(ELA)以使网络聚焦关键位置特征,构建了矿用滚动轴承故障诊断OD−ConvNeXt−ELA网络模型;为充分利用OD−ConvNeXt−ELA网络模型的图像特征提取能力,选用SLT将采集的滚动轴承一维振动信号转换为二维时频图像后输入OD−ConvNeXt−ELA进行模型训练。选用凯斯西储大学(CWRU)和帕德博恩大学(PU)轴承数据集进行故障诊断实验,结果表明:对于单一工况下的CWRU轴承数据集,OD−ConvNeXt−ELA平均故障诊断准确率为99.65%,较ConvNeXt−T提高了1.61%;对于跨工况下的CWRU轴承数据集,OD−ConvNeXt−ELA平均故障诊断准确率为87.50%,较ConvNeXt−T提高了3.30%;对于跨工况下的PU轴承数据集,OD−ConvNeXt−ELA平均故障诊断准确率为89.33%,较ConvNeXt−T提高了3.46%;基于SLT与OD−ConvNeXt−ELA的矿用滚动轴承故障诊断方法在跨轴承、跨工况及噪声干扰下具有准确率高、泛化能力强的优势。 展开更多
关键词 矿用滚动轴承 故障诊断 ConvNeXt 超小波变换 全维动态卷积 高效局部注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部