期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于感受野注意力卷积的自动驾驶多任务感知算法 被引量:4
1
作者 刘云翔 马海力 +2 位作者 朱建林 张晴 金婍 《计算机工程与应用》 CSCD 北大核心 2024年第20期133-141,共9页
可行驶区域分割、车道线检测及交通目标检测等作为自动驾驶感知的关键部分,并行执行对智能车辆的算力要求较高,多任务感知算法能够实现实际应用中精度与速度的权衡。针对多任务感知算法中路况复杂、目标受遮挡等难点,通过改进YOLOP网络... 可行驶区域分割、车道线检测及交通目标检测等作为自动驾驶感知的关键部分,并行执行对智能车辆的算力要求较高,多任务感知算法能够实现实际应用中精度与速度的权衡。针对多任务感知算法中路况复杂、目标受遮挡等难点,通过改进YOLOP网络,提出一种基于感受野注意力卷积(RFAConv)的多任务感知算法。将主干网络中的部分卷积替换为感受野注意力卷积,根据感受野中图像特征的重要程度动态分配卷积核权重以提高网络的特征提取能力;重构特征金字塔网络,使用高效跨尺度融合模块替换原有的跨阶段层次模块,充分保留特征融合的有效信息,并使用内容感知特征重组模块作为上采样方法,减少特征融合时上采样的信息丢失;使用MPDIoU函数计算回归损失,解决真实框与预测框之间同比例但不同大小的问题,进一步提高对交通目标的检测能力。在BDD100K数据集上的测试结果表明,该模型在可行驶区域分割、车道线检测及交通目标检测方面检测精度优于其他多任务模型甚至单任务模型,同时保证了网络实时推理性能。 展开更多
关键词 多任务感知 自动驾驶 目标检测 语义分割 感受注意力卷积(rfaconv)
在线阅读 下载PDF
多感受野增强的爆破现场安全帽检测算法
2
作者 王新良 王璐莹 《计算机工程与应用》 北大核心 2025年第7期315-324,共10页
针对安全帽检测任务中存在的目标面积小、目标被不同程度遮挡、复杂背景干扰目标等问题,提出了基于YOLOX的多感受野增强的安全帽检测算法(multiple receptive field enhancement-YOLOX,MRFE-YOLOX)。在特征融合网络中增加浅层特征融合分... 针对安全帽检测任务中存在的目标面积小、目标被不同程度遮挡、复杂背景干扰目标等问题,提出了基于YOLOX的多感受野增强的安全帽检测算法(multiple receptive field enhancement-YOLOX,MRFE-YOLOX)。在特征融合网络中增加浅层特征融合分支,提升小目标特征信息流通效率,提高了小目标的检测精度;设计基于空洞卷积组与卷积注意力机制的感受野增强模块(receptive field augmentation module,RFAM),捕获了更大范围的感受野和图像特征,改善了遮挡目标漏检率高的问题;根据三分支注意力机制构建特征增强网络(feature enhancement network,FENet),抑制背景噪音对目标区域的干扰,降低了复杂背景下的目标误检率;引入空间到深度卷积(space to depth-conv,SPD-Conv)得到无信息损失的二倍下采样特征图,保留了更多的特征信息,同时减少了模型的参数量。实验结果表明,所提算法的均值平均精度相较于基线算法提升了2.78个百分点,FPS达到了102.67,满足了爆破现场安全帽实时检测的需要。 展开更多
关键词 安全帽检测 YOLOX-s算法 感受 空洞卷积 注意力机制
在线阅读 下载PDF
基于空洞卷积和注意力机制的深度伪造检测 被引量:6
3
作者 张时润 彭勃 +1 位作者 王伟 董晶 《现代电子技术》 2022年第5期42-48,共7页
人脸深度伪造图像的生成过程是对目标人脸进行替换,由于不同图片的肤色和光照等差异,在人脸周围会产生比较分散的伪影边界,且对人脸进行裁剪之后会包含部分背景信息的干扰。针对深度伪造图像的生成特点,区别于常规的CNN分类识别网络,设... 人脸深度伪造图像的生成过程是对目标人脸进行替换,由于不同图片的肤色和光照等差异,在人脸周围会产生比较分散的伪影边界,且对人脸进行裁剪之后会包含部分背景信息的干扰。针对深度伪造图像的生成特点,区别于常规的CNN分类识别网络,设计了一种符合伪造痕迹特点的检测网络。首先,利用Resnet34卷积神经网络对待检测的图像提取初步的伪造特征;其次,经过空洞卷积提高网络模型的感受野来更好地捕获比较分散的伪造痕迹;再由空间注意力模块进行权重的重加权,减少其他背景信息的干扰;最后使用多层全连接神经网络对特征进行分类,达到对深度伪造图片进行准确分类的目的。在Faceforensics++、Celeb-DF、DFDC三个主流数据集上进行实验,并取得比当前其他方法更好的效果。实验结果表明,所提方法结合了空洞卷积和注意力机制,应对不同人脸截取比例的伪造图像拥有更好的适应性。 展开更多
关键词 图像深度伪造 空洞卷积 注意力机制 深度学习 图像分类 伪造特征提取 感受
在线阅读 下载PDF
结合全局注意力机制的实时语义分割网络 被引量:5
4
作者 李涛 高志刚 +2 位作者 管晟媛 徐久成 马媛媛 《智能系统学报》 CSCD 北大核心 2023年第2期282-292,共11页
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s... 针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。 展开更多
关键词 实时语义分割 全局注意力机制 多尺度特征融合 混合空洞卷积 卷积神经网络 金字塔池化 感受 特征提取
在线阅读 下载PDF
基于多感受野的生成对抗网络医学MRI影像超分辨率重建 被引量:4
5
作者 刘朋伟 高媛 +2 位作者 秦品乐 殷喆 王丽芳 《计算机应用》 CSCD 北大核心 2022年第3期938-945,共8页
针对医学磁共振成像(MRI)过程中由于噪声、成像技术和成像原理等干扰因素引起的图像细节丢失、纹理不清晰等问题,提出了基于多感受野的生成对抗网络医学MRI影像超分辨率重建算法。首先,利用多感受野特征提取块获取不同感受野下图像的全... 针对医学磁共振成像(MRI)过程中由于噪声、成像技术和成像原理等干扰因素引起的图像细节丢失、纹理不清晰等问题,提出了基于多感受野的生成对抗网络医学MRI影像超分辨率重建算法。首先,利用多感受野特征提取块获取不同感受野下图像的全局特征信息,为避免感受野过小或过大导致图像的细节纹理丢失,将每组特征分为两组,其中一组用于反馈不同尺度感受野下的全局特征信息,另一组用于丰富下一组特征的局部细节纹理信息;然后,使用多感受野特征提取块构建特征融合组,并在每个特征融合组中添加空间注意力模块,充分获取图像的空间特征信息,减少了浅层和局部特征在网络中的丢失,在图像的细节上取得了更逼真的还原度;其次,将低分辨率图像的梯度图转化为高分辨率图像的梯度图辅助重建超分辨率图像;最终将恢复后的梯度图集成到超分辨率分支中,为超分辨率重建提供结构先验信息,有助于生成高质量的超分辨率图像。实验结果表明,相比基于梯度引导的结构保留超分辨率算法(SPSR),所提算法在×2、×3、×4尺度下的峰值信噪比(PSNR)分别提升了4.8%、2.7%、3.5%,重建出的医学MRI影像纹理细节更加丰富、视觉效果更加逼真。 展开更多
关键词 超分辨率 感受 空洞卷积 空间注意力机制 梯度图
在线阅读 下载PDF
融合多注意力机制的光学遥感图像目标检测方法 被引量:18
6
作者 付宏建 白宏阳 +2 位作者 郭宏伟 原瑜蔓 秦伟伟 《光子学报》 EI CAS CSCD 北大核心 2022年第12期304-312,共9页
针对光学遥感图像因目标尺度差异大、目标分布密集和背景复杂所导致的检测效果不佳的问题,提出了一种融合多注意力机制的遥感目标检测方法。设计了一种自适应感受野大小的坐标注意力模块,以加强网络对多尺度目标特征的提取能力,提升网... 针对光学遥感图像因目标尺度差异大、目标分布密集和背景复杂所导致的检测效果不佳的问题,提出了一种融合多注意力机制的遥感目标检测方法。设计了一种自适应感受野大小的坐标注意力模块,以加强网络对多尺度目标特征的提取能力,提升网络对复杂背景下目标的定位效果。基于Swin Transformer自注意力机制模块改进了YOLOv5网络的预测头,增强了网络对密集分布目标的识别能力。在DOTA公开遥感图像数据集上进行训练与测试,实验对比结果表明,所提方法在检测精度上比YOLOv5网络提高了3.6%,且优于多类典型对比方法;在Nvidia GTX 1080Ti平台上检测速度达49帧/s,证明该方法具有较好的实时检测能力。 展开更多
关键词 光学遥感图像 目标检测 深度学习 注意力机制 感受 多尺度 卷积神经网络
在线阅读 下载PDF
基于改进注意力机制的交通标志检测算法 被引量:7
7
作者 张新宇 丁胜 杨治佩 《计算机应用》 CSCD 北大核心 2022年第8期2378-2385,共8页
针对交通标志在某些场景中存在分辨率过低、被覆盖等环境因素影响导致在目标检测任务中出现漏检、误检的情况,提出一种基于改进注意力机制的交通标志检测算法。首先,针对交通标志因破损、光照等环境影响造成图像分辨率低从而导致网络提... 针对交通标志在某些场景中存在分辨率过低、被覆盖等环境因素影响导致在目标检测任务中出现漏检、误检的情况,提出一种基于改进注意力机制的交通标志检测算法。首先,针对交通标志因破损、光照等环境影响造成图像分辨率低从而导致网络提取图像特征信息有限的问题,在主干网络中添加注意力模块以增强目标区域的关键特征;其次,特征图中相邻通道间的局部特征由于感受野重叠而存在一定的相关性,用大小为k的一维卷积代替通道注意力模块中的全连接层,以达到聚合不同通道信息和减少额外参数量的作用;最后,在路径聚合网络(PANet)的中、小尺度特征层引入感受野模块来增大特征图的感受野以融合目标区域的上下文信息,从而提升网络对交通标志的检测能力。在中国交通标志检测数据集(CCTSDB)上的实验结果表明,所提出的YOLOv4(YouOnlyLookOncev4)改进算法在引进极少的参数量与原算法检测速度相差不大的情况下,平均精确率均值(mAP)达96.88%,mAP提升了1.48%;而与轻量级网络YOLOv5s相比,在单张检测速度慢10 ms的情况下,所提算法mAP比YOLOv5s高3.40个百分点,检测速度达到40frame/s,说明该算法完全满足目标检测实时性的要求。 展开更多
关键词 注意力机制 一维卷积 感受模块 特征提取网络 YOLOv4
在线阅读 下载PDF
扩增感受野特征融合的小目标检测算法 被引量:9
8
作者 魏文晓 刘洁瑜 +1 位作者 徐军辉 沈强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第1期48-54,共7页
为了解决小目标检测在实际应用中的高漏检率、低准确率、低召回率等问题,提出一种基于感受野扩增特征融合的小目标检测算法.首先,对全卷积单阶段目标检测算法(fully convolutional one-stage object detection,FCOS)基础网络特征提取部... 为了解决小目标检测在实际应用中的高漏检率、低准确率、低召回率等问题,提出一种基于感受野扩增特征融合的小目标检测算法.首先,对全卷积单阶段目标检测算法(fully convolutional one-stage object detection,FCOS)基础网络特征提取部分增加感受野扩增模块,改善基础网络ResNet-50特征信息提取较少、浅层特征层信息利用率偏低等问题;其次,在特征金字塔部分利用门控思想筛选信息融合,降低无效信息融合的干扰;最后,对7个特征层增加注意力机制模块,提升目标定位精度和分类精度.在COCO2017数据集上的实验结果表明,该算法比传统FCOS算法的检测精度提升2.4%.其中,小目标检测精度提升3.2%,具有更好的检测效果. 展开更多
关键词 特征融合 感受扩增 串联空洞卷积 注意力机制 无锚框算法
在线阅读 下载PDF
基于全局时空感受野的高效视频分类方法
9
作者 王辉涛 胡燕 《小型微型计算机系统》 CSCD 北大核心 2020年第8期1768-1775,共8页
在现有混合卷积神经网络架构(2D+3D)的视频分类方法中,卷积滤波器都是对局部区域进行操作,无法捕获大范围的时空依赖关系,特征通道之间缺乏相互依赖关系,传统的三维卷积核无法很好地建模时空特征.针对这些问题,提出了一种基于全局时空... 在现有混合卷积神经网络架构(2D+3D)的视频分类方法中,卷积滤波器都是对局部区域进行操作,无法捕获大范围的时空依赖关系,特征通道之间缺乏相互依赖关系,传统的三维卷积核无法很好地建模时空特征.针对这些问题,提出了一种基于全局时空感受野的高效视频分类方法(CS-NL-SECO).首先将传统的三维卷积核分解成空域卷积核和时域卷积核,来更好地学习时空特征.然后在已有混合架构中的底层二维网络引入通道和空间注意力,通过学习自动获取每个特征通道的权重,依照权重关注重要的特征而抑制不相关的背景.最后在高层三维网络中引入全局时空感受野,学习全局时空特征表示自动捕获大范围的时空依赖关系.并在UCF101、HMDB51、Kinetics以及Something-something这四个视频分类常用的公有数据集上进行了实验,结果表明该方法无论在速度和精度上都远好于原方法,并且整体性能达到了最新方法的基准. 展开更多
关键词 视频分类 卷积神经网络 通道和空间注意力 全局时空感受 三维卷积核分解
在线阅读 下载PDF
自适应采样与重影多尺度特征融合的轻量化焊缝缺陷检测
10
作者 鲁斌 杨烜 +1 位作者 杨振宇 高啸天 《系统仿真学报》 北大核心 2025年第8期1978-1990,共13页
为提升焊接缺陷识别的准确率和速度,并实现模型的轻量化,提出了一种基于YOLOv8的轻量化焊缝缺陷检测网络LAW-YOLO(light adaptive-weight sampling-YOLO)。设计了一种轻量级自适应权重采样LAWS模块,通过学习感受野区域内交互的特征来构... 为提升焊接缺陷识别的准确率和速度,并实现模型的轻量化,提出了一种基于YOLOv8的轻量化焊缝缺陷检测网络LAW-YOLO(light adaptive-weight sampling-YOLO)。设计了一种轻量级自适应权重采样LAWS模块,通过学习感受野区域内交互的特征来构建自适应权重注意力特征图。采用优化的高效加权双向特征金字塔网络作为LAW-YOLO中的特征提取网络,设计重影多尺度采样模块并引用了混合注意力机制,以增强对小目标缺陷的检测能力。实验结果表明:该方法在SteelTube数据集中mAP0.5达到97.6%,处理数据速度可达91帧/s,比基线模型提高了5.5%的平均精度及4.6%的处理速度,在保持高效性能的同时减少了25.3%的计算量和50%的模型大小,更便于部署在边缘设备上进行场景作业。 展开更多
关键词 缺陷检测 YOLOv8 重影多尺度卷积 感受空间特征 混合注意力机制
在线阅读 下载PDF
基于改进YOLOv8s模型的机械零件视觉检测算法
11
作者 荣国林 晁永生 +1 位作者 蒋潇 王传钊 《组合机床与自动化加工技术》 北大核心 2025年第3期31-35,40,共6页
针对非结构环境下机械零件检测任务高精度的需求,提出了一种改进YOLOv8s目标算法。通过引入可变形卷积优化骨干C2f结构(C2f_DCNV2),帮助模型快速地提取更细粒的空间特征;引入空间注意力改造空间金字塔池化层(SPPF_RFA),增加不同层级特... 针对非结构环境下机械零件检测任务高精度的需求,提出了一种改进YOLOv8s目标算法。通过引入可变形卷积优化骨干C2f结构(C2f_DCNV2),帮助模型快速地提取更细粒的空间特征;引入空间注意力改造空间金字塔池化层(SPPF_RFA),增加不同层级特征间的信息交融能力和识别复杂细节的能力,提升目标零件的检测精度;使用α-DIoU改进边界框回归损失函数,提高模型边界框定位的精确性和收敛速度。实验结果表明,改进YOLOv8s算法在98帧/秒(FPS)下实现了97.6%的平均精度均值(mAP),相较原算法表现出了更高的准确率和更快的推理速度。 展开更多
关键词 机械零件 目标检测 YOLOv8s 感受注意力 可变形卷积
在线阅读 下载PDF
多尺度YOLOv5算法检测锂离子电池表面缺陷
12
作者 朱永平 程博 +1 位作者 熊聪 丁聪 《电池》 北大核心 2025年第1期71-77,共7页
针对软包装锂离子电池表面缺陷特征尺度不一、缺陷检测时小目标检测效果差的问题,提出基于改进YOLOv5的软包装锂离子电池表面缺陷检测算法。首先,将感受野注意力卷积(RFCAConv)融合到Bottleneck结构中,并替换主干网络中的卷积层(Conv),... 针对软包装锂离子电池表面缺陷特征尺度不一、缺陷检测时小目标检测效果差的问题,提出基于改进YOLOv5的软包装锂离子电池表面缺陷检测算法。首先,将感受野注意力卷积(RFCAConv)融合到Bottleneck结构中,并替换主干网络中的卷积层(Conv),通过有效提取感受野空间特征,提升模型整体性能;其次,将大型可分离核注意力(LSKA)融合到快速空间金字塔池化(SPPF)模块中,增强多尺度特征的提取能力;最后,将P2目标检测层融入路径聚合网络(PANet),提高模型对边缘细节信息的抓取能力,增强模型对小尺度缺陷特征的提取能力。改进后的YOLOv5s算法,均值平均精度为89.1%,较原模型提高4.8个百分点,每秒帧数达40.0,能够满足软包锂离子电池表面缺陷实时检测的需求。 展开更多
关键词 YOLOv5算法 锂离子电池 缺陷检测 感受注意力卷积(RFCAConv) 可分离大核注意力 P2检测层
在线阅读 下载PDF
多维度卷积的两阶段脊柱三维实例分割方法 被引量:4
13
作者 程敏 沈林鹏 罗作煌 《传感器与微系统》 CSCD 北大核心 2022年第12期134-138,共5页
为实现对人体脊椎CT 3D图像精确实例分割,提出了一种融合2D与3D卷积神经网络(CNN)的2阶段脊柱3D实例分割关键技术。第一阶段采用ResNet—101 2D CNN作为骨干网络,引入可变感受野卷积模块对卷积结构主干特征网络优化,并加入损失函数平衡... 为实现对人体脊椎CT 3D图像精确实例分割,提出了一种融合2D与3D卷积神经网络(CNN)的2阶段脊柱3D实例分割关键技术。第一阶段采用ResNet—101 2D CNN作为骨干网络,引入可变感受野卷积模块对卷积结构主干特征网络优化,并加入损失函数平衡机制,较好地解决了对脊柱CT数字重建图像(DRR) 2D图像实例分割,准确获取脊柱各椎节2D实例信息;第二阶段以3D Unet为主要框架,融入Dense CRF条件随机场模块、空间与通道注意力方法,分割精度最高达到98.53%。该研究为脊椎手术导航机器人精准完成术前与术中导航与配准提供了有意义的参考。 展开更多
关键词 感受 注意力机制 鲁棒性 实例分割 三维卷积
在线阅读 下载PDF
基于改进YOLO v8n的甜菜杂草检测算法研究 被引量:2
14
作者 黄友锐 王小桥 +2 位作者 韩涛 宋红萍 王照锋 《江苏农业科学》 北大核心 2024年第24期196-204,共9页
农作物生长过程中其伴生杂草的及时清除能够有效提高农作物的产量和质量。针对当前对于甜菜杂草检测精度较低、小目标漏检等问题,提出了基于改进YOLO v8n的甜菜杂草检测算法。首先,在检测头部分增加一个小目标检测层,提高模型对生长初... 农作物生长过程中其伴生杂草的及时清除能够有效提高农作物的产量和质量。针对当前对于甜菜杂草检测精度较低、小目标漏检等问题,提出了基于改进YOLO v8n的甜菜杂草检测算法。首先,在检测头部分增加一个小目标检测层,提高模型对生长初期甜菜和杂草的检测能力。其次,在主干部分引入感受野坐标注意力卷积(receptive-field coordinated attention convolutional operation,RFCAConv),更好地识别图像中的边缘、纹理、形状等低级特征,并且所增加的计算开销极小。最后,引入损失函数PIoU v2替换YOLO v8n原来的损失函数,增强对中等质量锚框的聚焦能力,加快收敛速度,并提高检测精度。通过公开的Lincolnbeet数据集进行试验,试验结果表明,改进后的YOLO v8n模型总的mAP@0.5达到了0.902,对比YOLO v8n原模型提高了0.035,甜菜和杂草分别提升了0.026、0.041,参数量减少了3.3%,平均每幅图片的检测时间为4.1 ms,能够满足实时检测的要求。 展开更多
关键词 甜菜 杂草识别 YOLO v8n 感受坐标注意力卷积 小目标检测
在线阅读 下载PDF
基于改进SwiftNet的堆场图像实时分割网络
15
作者 陈晓玉 沈晨 +1 位作者 沈阅 孔德明 《计算机工程》 CAS CSCD 北大核心 2024年第6期296-303,共8页
在堆场环境下,实时图像语义分割可以提供直观的场景类别信息。为节约工控机等边缘设备的硬件资源以及为多源信息融合提供图像语义类别信息,提出一种轻量化的实时语义分割网络模型。首先提出基于空间注意力引导的上采样融合模块,通过引... 在堆场环境下,实时图像语义分割可以提供直观的场景类别信息。为节约工控机等边缘设备的硬件资源以及为多源信息融合提供图像语义类别信息,提出一种轻量化的实时语义分割网络模型。首先提出基于空间注意力引导的上采样融合模块,通过引入空间注意力和残差注意力结构设计一种轻量化的解码器,在上采样过程中还原空间细节,抑制冗余信息,进而融合不同来源的特征图;其次提出一种轻量化的级联空洞空间金字塔模块,利用级联的空洞卷积单元增大网络感受野,有效提取多尺度特征;最后使用通道分离、通道混洗、通道池化等操作,降低多尺度聚合过程中的计算开销。在公开数据集Camvid上,该模型的平均交并比(MIoU)为70.1%,推理速度为146.3帧/s,分割精度和推理速度优于ENet、ICNet等模型,消融实验结果也证明了所提各模块的有效性;在实际堆场图像数据集上,该模型的MIoU为93.5%,推理速度为123.8帧/s,证明模型结构具有良好的泛化性能。 展开更多
关键词 实时语义分割 注意力机制 空洞卷积 感受 堆场图像
在线阅读 下载PDF
面向无人机视角下小目标检测的YOLOv8s改进模型 被引量:35
16
作者 潘玮 韦超 +1 位作者 钱春雨 杨哲 《计算机工程与应用》 CSCD 北大核心 2024年第9期142-150,共9页
从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(conce... 从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以innerMPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。 展开更多
关键词 无人机 小目标检测 YOLOv8s 感受注意力 大型可分离卷积
在线阅读 下载PDF
改进变分自编码器的工业时序数据异常检测 被引量:5
17
作者 张志昂 廖光忠 《计算机工程与设计》 北大核心 2024年第1期17-23,共7页
为解决传统的异常检测模型对工业时序数据异常点检测方面误判率大和抗干扰性差的问题,提出一种改进的变分自编码器模型。考虑到工业时序数据的不规律性,使用变分自编码器模型作为基础架构;由于变分自编码器本身存在难以准确检测出异常... 为解决传统的异常检测模型对工业时序数据异常点检测方面误判率大和抗干扰性差的问题,提出一种改进的变分自编码器模型。考虑到工业时序数据的不规律性,使用变分自编码器模型作为基础架构;由于变分自编码器本身存在难以准确检测出异常时序数据的问题,在编码和解码过程中分别引入时间卷积网络和通道注意力机制,实现扩大感受野和增强特征权重;对数据时序数据使用随机森林进行特征排序,提高检测的准确性。通过进行对比测试实验,验证了该模型可以有效提高对异常工业时序数据点检测的准确性和可靠性。 展开更多
关键词 异常检测 时间卷积网络 变分自编码器 通道注意力机制 时序数据 随机森林 感受
在线阅读 下载PDF
面向高空视角小目标检测的YOLO算法改进策略 被引量:1
18
作者 曹嘉禹 乔贵方 +2 位作者 陈梦源 邹旭 刘娣 《计算机应用》 CSCD 北大核心 2024年第S2期280-285,共6页
针对无人机高空视角下背景复杂、特征提取能力不足、目标尺寸小、难以检测、漏检严重等问题,在YOLOv8n的基础上提出改进的无人机高空视角目标检测算法。首先优化网络结构,通过增加P2小目标检测层并删去P5大目标检测层提升小目标感知能力... 针对无人机高空视角下背景复杂、特征提取能力不足、目标尺寸小、难以检测、漏检严重等问题,在YOLOv8n的基础上提出改进的无人机高空视角目标检测算法。首先优化网络结构,通过增加P2小目标检测层并删去P5大目标检测层提升小目标感知能力;其次引入感受野注意力卷积(RFAConv)以改进C2f的颈部结构,并从空间维度提高网络的特征提取及特征融合能力;再次将动态头(Dyhead)模块引入Detect检测头,从而增强模型的表达能力和泛化能力;最后使用归一化Wasserstein距离(NWD)度量边界框相似性,从而降低尺度敏感性。在Visdrone2019数据集上,改进后的YOLOv8n、YOLOv9t和YOLOv10n与改进前的相比,在平均精度(AP)上分别提升了15.6%、16.7%和31.0%;在SAR舰船检测数据集(SSDD)上的检测结果表明改进算法泛化能力较好,具有较强的鲁棒性。可见改进后的算法提升了小目标特征提取及融合能力,并具有更好的小目标检测效果。 展开更多
关键词 YOLOv8n 小目标检测 感受注意力卷积 动态头 归一化Wasserstein距离
在线阅读 下载PDF
基于YOLO-MCG的PCB缺陷检测算法 被引量:5
19
作者 胡兰兰 邓超 《仪表技术与传感器》 CSCD 北大核心 2024年第4期100-106,共7页
为解决PCB缺陷检测中存在检测精度低,模型尺寸庞大的问题,文中提出基于YOLO-MCG的PCB缺陷检测算法。首先提出多尺度加权通道融合网络缩减模型体积,扩增小目标数据。接着提出混合空间金字塔卷积替换主干网络中SPP结构,扩大深层特征图感受... 为解决PCB缺陷检测中存在检测精度低,模型尺寸庞大的问题,文中提出基于YOLO-MCG的PCB缺陷检测算法。首先提出多尺度加权通道融合网络缩减模型体积,扩增小目标数据。接着提出混合空间金字塔卷积替换主干网络中SPP结构,扩大深层特征图感受野,增强模型语义信息特征提取性能。最后构建轻量化CG-CSP模块替换主干网络最深层CSP结构,减少网络参数,提高网络过滤冗余背景信息能力。实验结果表明,YOLO-MCG算法在8.13 MB的模型尺寸下平均精度均值为97.72%,与改进前模型比较,mAP提升3.77%,模型尺寸缩减69.89%,有效降低模型复杂度,提升缺陷检测效果。 展开更多
关键词 PCB缺陷检测 小目标 混合空间金字塔卷积 轻量化 注意力机制 感受
在线阅读 下载PDF
基于改进YOLOv5的带式输送机大块煤检测 被引量:1
20
作者 秦宇龙 程继明 +3 位作者 任一个 王晓晴 赵青 安翠娟 《工矿自动化》 CSCD 北大核心 2024年第2期57-62,71,共7页
过大的煤块在带式输送机上运输时易造成煤流不畅、堵塞及堆煤,然而大块煤和普通煤块在外形和颜色上的差异较小,且煤块间存在遮挡和堆叠的情况,现有煤块检测方法对大块煤与普通煤块的区分不够精确,容易出现漏检或误检。针对上述问题,提... 过大的煤块在带式输送机上运输时易造成煤流不畅、堵塞及堆煤,然而大块煤和普通煤块在外形和颜色上的差异较小,且煤块间存在遮挡和堆叠的情况,现有煤块检测方法对大块煤与普通煤块的区分不够精确,容易出现漏检或误检。针对上述问题,提出了一种改进YOLOv5模型,用于带式输送机大块煤检测。利用并行空洞卷积模块替换YOLOv5骨干网络中的部分普通卷积模块,扩大感受野,提升多尺度特征学习能力,从而更好地区分大块煤与普通煤块;在颈部网络中加入联合注意力模块,更好地融合上下文信息,提高对大块煤的定位能力。利用训练好的改进YOLOv5模型对摄像仪采集的实时输煤视频进行检测,根据大块煤的数量信息实时联动PLC示警。实验结果表明:相比于原始YOLOv5模型,改进YOLOv5模型在召回率和平均精度上分别提高了3.4%,2.0%;PLC可根据改进YOLOv5模型检测出的大块煤数量操作相应的指示灯和蜂鸣器进行示警;将改进YOLOv5模型应用于煤矿井下实际输煤视频中,对大块煤的检测精确率达97.0%,有效避免了漏检和误检现象。 展开更多
关键词 带式输送机 大块煤检测 YOLOv5 空洞卷积 注意力机制 PLC联动示警 感受
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部