期刊文献+
共找到277篇文章
< 1 2 14 >
每页显示 20 50 100
FMA-DETR:一种无编码器的Transformer目标检测方法 被引量:1
1
作者 周全 倪英豪 +2 位作者 莫玉玮 康彬 张索非 《信号处理》 CSCD 北大核心 2024年第6期1160-1170,共11页
DETR是第一个将Transformer应用于目标检测的视觉模型。在DETR结构中,Transformer编码器对已高度编码的图像特征进行再编码,这在一定程度上导致了网络功能的重复。此外,由于Transformer编码器具有多层深度堆叠的结构和巨大的参数量,导... DETR是第一个将Transformer应用于目标检测的视觉模型。在DETR结构中,Transformer编码器对已高度编码的图像特征进行再编码,这在一定程度上导致了网络功能的重复。此外,由于Transformer编码器具有多层深度堆叠的结构和巨大的参数量,导致网络优化变得困难,模型收敛速度缓慢。本文设计了一种无编码器的Transformer目标检测网络模型。由于不需要引入Transformer编码器,本文的模型比DETR参数量更小、计算量更低、模型收敛速度更快。但是,直接去除Transformer编码器将降低网络的表达能力,导致Transformer解码器无法从数量庞大的图像特征中关注到包含目标的图像特征,从而使检测性能大幅降低。为了缓解这个问题,本文提出了一种混合特征注意力(fusion-feature mixing attention,FMA)机制,它通过自适应特征混合和通道交叉注意力弥补检测网络特征表达能力的下降,将其应用于Transformer解码器可以减轻由于去除Transformer编码器带来的性能降低。在MS-COCO数据集上,本文网络模型(称为FMA-DETR)实现了与DETR相近的性能表现,同时本文的模型拥有更快的收敛速度、更小的参数量以及更低的计算量。本文还进行了大量消融实验来验证所提出方法的有效性。 展开更多
关键词 目标检测 transformer 编码器 detr 混合注意力
在线阅读 下载PDF
基于轻量级改进RT-DETR边缘部署算法的绝缘子缺陷检测 被引量:3
2
作者 姜香菊 王瑞彤 马彦鸿 《电工技术学报》 北大核心 2025年第3期842-854,共13页
随着新型电力系统的不断发展建设,输电线路绝缘子状态智能化巡检成为必然趋势。为方便“云-边-端协同架构”进行边缘部署,该文提出一种轻量级RT-DETR目标检测算法。首先,采用RT-DETR作为基线算法降低优化难度,提高鲁棒性;其次,选择轻量... 随着新型电力系统的不断发展建设,输电线路绝缘子状态智能化巡检成为必然趋势。为方便“云-边-端协同架构”进行边缘部署,该文提出一种轻量级RT-DETR目标检测算法。首先,采用RT-DETR作为基线算法降低优化难度,提高鲁棒性;其次,选择轻量级EMO作为算法特征提取主干,充分学习绝缘子目标的长距离特征交互及缺陷小目标的局部特征交互,并提出基于轻量级注意力的尺度内特征交互模块和轻量级跨尺度特征融合模块设计轻量级高效混合编码器;再次,在轻量级高效混合编码器中引入定位信息补充分支、使用DIoU损失函数结合迁移学习训练技巧,缓解轻量化造成的算法精度下降问题;最后,构建多天气条件绝缘子数据集进行训练验证。实验结果表明,相较于基线算法,所提算法检测精度达到97.2%,只损失0.7个百分点,而参数量和计算量分别下降67.8%和71.2%,检测速度提升2.5倍,满足多天气条件下的输电线路绝缘子状态巡检准确率及边缘部署轻量化要求。 展开更多
关键词 绝缘子缺陷检测 RT-detr算法 轻量化 边缘部署 目标检测算法
在线阅读 下载PDF
SDH-DETR轻量化绝缘子缺陷检测算法
3
作者 周景 刘心 +1 位作者 唐振洋 董晖 《电子测量技术》 北大核心 2025年第11期88-104,共17页
为解决无人机在输电线路绝缘子巡检中目标检测算法面临的模型复杂度高、小目标缺陷检测精度不足和上下采样过程中容易造成特征丢失等挑战,本文提出了一种基于轻量化改进的RT-DETR绝缘子缺陷检测算法(SDH-DETR)。首先,以RT-DETR作为基线... 为解决无人机在输电线路绝缘子巡检中目标检测算法面临的模型复杂度高、小目标缺陷检测精度不足和上下采样过程中容易造成特征丢失等挑战,本文提出了一种基于轻量化改进的RT-DETR绝缘子缺陷检测算法(SDH-DETR)。首先,以RT-DETR作为基线算法,降低优化难度并提高鲁棒性;其次,采用轻量级StarNet作为主干网络,在显著降低模型复杂度的同时提升特征提取能力;接着,引入DySample动态上采样模块,通过基于采样点的自适应上采样方法,有效减少细节丢失与图像失真;最后,利用Harr小波变换下采样模块(HWD),实现低频与高频信息的高效融合,抑制复杂背景干扰并增强对小目标的检测能力。在复杂背景数据集上的验证实验表明,SDH-DETR的平均精度达98.5%,较基线算法提升0.9%,参数量和计算量分别减少43%和46.1%,检测速度达78.6 fps。这表明该算法在保证高准确性的同时,实现了轻量化设计,满足了输电线路巡检对效率和性能的实际需求。 展开更多
关键词 输电线路 目标检测 绝缘子缺陷检测 复杂背景 轻量化 RT-detr算法
在线阅读 下载PDF
改进RT-DETR的无人机图像目标检测算法 被引量:4
4
作者 姜贸翔 司占军 王晓喆 《计算机工程与应用》 北大核心 2025年第1期98-108,共11页
针对轻小型无人机图像目标检测中由于目标灵活多样、环境复杂多变导致的检测精度低等问题,提出基于改进RT-DETR无人机目标检测算法。综合考虑轻量级SimAM注意力和倒置残差模块改进ResNet-r18主干网络,提高目标检测模型的特征提取能力。... 针对轻小型无人机图像目标检测中由于目标灵活多样、环境复杂多变导致的检测精度低等问题,提出基于改进RT-DETR无人机目标检测算法。综合考虑轻量级SimAM注意力和倒置残差模块改进ResNet-r18主干网络,提高目标检测模型的特征提取能力。采用级联分组注意力机制优化倒置残差模块和特征交互模块,提升特征选择能力,实现目标检测信息的精细化获取。颈部网络中引入160×160检测层,提升特征融合阶段小目标的感知能力。基于VisDrone2019数据集的实验结果表明,改进后的模型具有更低的参数量和更高的检测精度。在Alver_Lab_Ulastirma和HIT-UAV数据集上进一步验证了改进方法的有效性和鲁棒性。 展开更多
关键词 小目标检测 detr 注意力机制 transformer 残差链接
在线阅读 下载PDF
基于改进RT-DETR的航拍图像小目标检测算法
5
作者 宣岁寒 罗印升 宋伟 《电光与控制》 北大核心 2025年第4期44-51,共8页
实时、准确地定位与识别航拍图像中飞机、轮船和车辆等目标是进一步决策的根本基础,针对航拍图像中小目标检测存在的效率和精度低等问题,提出了一种基于改进RT-DETR的航拍图像小目标检测算法。首先,通过构建高效的CCFM-P2ASF尺度序列特... 实时、准确地定位与识别航拍图像中飞机、轮船和车辆等目标是进一步决策的根本基础,针对航拍图像中小目标检测存在的效率和精度低等问题,提出了一种基于改进RT-DETR的航拍图像小目标检测算法。首先,通过构建高效的CCFM-P2ASF尺度序列特征融合模块,获得更丰富的语义信息,同时提高对小目标的敏感度;其次,集成灵活性更强的可学习的位置编码,提供更清晰的位置界定;然后,设计更高效的边界框损失函数,减小对目标位置预测的偏差,提供更准确的边界框信息;最后,构建EMA重参数响应模块,从而更有效地提取输入图像特征。实验结果表明:改进后的RT-DETR模型较原始模型参数量减少38.3%,精确率、mAP50和mAP50∶95指标分别提升5.1、5.0和2.2个百分点。对比其他同类主流算法模型,在航拍小目标检测任务中具有更好的检测效果。 展开更多
关键词 小目标检测 RT-detr算法 特征融合 定位损失 位置编码
在线阅读 下载PDF
基于改进RT-DETR的小目标检测算法
6
作者 王康 王小林 +1 位作者 刘心智 邓健志 《现代电子技术》 北大核心 2025年第13期50-56,共7页
针对小目标检测任务中目标占图片比例小、语义信息少,因此检测中常出现漏检、误检等问题。文中提出一种改进RT-DETR的小目标检测模型,在保证实时性的前提下提高检测性能。首先,对RT-DETR模型中的主干网络进行改进,设计部分重新参数化卷... 针对小目标检测任务中目标占图片比例小、语义信息少,因此检测中常出现漏检、误检等问题。文中提出一种改进RT-DETR的小目标检测模型,在保证实时性的前提下提高检测性能。首先,对RT-DETR模型中的主干网络进行改进,设计部分重新参数化卷积模块,提高了特征提取效率;然后,引入高效多尺度注意力机制,结合空间和跨空间信息聚合的方法,在AIFI编码器中使用HiLo注意力机制,减少了计算成本,提高了检测算法的鲁棒性;最后,在FloW-Img水上小目标数据集上开展实验,结果显示,改进后的RT-DETR模型相较于基线RT-DETR模型在漏检率和误检率方面均有所降低。在测试集上,算法的mAP@0.5指标达到了0.841,mAP@0.5:0.95指标为0.394。相比基线RT-DETR模型,mAP@0.5和mAP@0.5:0.95分别提升了5.5%和3.7%。检测效果优于基线模型与YOLO系列目标检测模型。 展开更多
关键词 小目标检测 RT-detr模型 PCov transformer EMA HiLo注意力机制
在线阅读 下载PDF
多尺度特征优化的实时Transformer在无人机航拍中的研究
7
作者 向毅伟 蒋瑜 +1 位作者 王琪凯 罗熔熔 《计算机工程与应用》 北大核心 2025年第9期221-229,共9页
针对无人机目标检测场景中的目标尺度小、遮挡严重、样本分布不均匀等问题,提出了一种改进实时检测Transformer(real-time detection Transformer,RT-DETR)的MSM-DETR检测器。在颈部网络中设计并引入了DSSF特征融合结构,通过结合维度感... 针对无人机目标检测场景中的目标尺度小、遮挡严重、样本分布不均匀等问题,提出了一种改进实时检测Transformer(real-time detection Transformer,RT-DETR)的MSM-DETR检测器。在颈部网络中设计并引入了DSSF特征融合结构,通过结合维度感知选择性整合(DASI)模块以及尺度序列特征融合(SSFF)模块丰富特征融合阶段小目标信息,提高检测精度。针对遮挡严重和样本分布不均匀的问题,提出多核并行尺度间融合(multi-core parallel scale fusion,MCPSF)模块,通过利用尺度间融合思想改进多核分组卷积带来的尺度间信息不平衡问题,为模型提供多尺度感受野,同时利用EMA注意力进一步增强组内上下文信息,提升检测精度。将Inner思想融入原损失函数中,通过引入不同尺度的辅助边框计算损失,加速收敛。实验结果表明,改进后的模型在VisDrone2019数据集中的验证集和测试集的mAP为49.5%、38.9%,较原模型分别提升2.5、2.4个百分点。 展开更多
关键词 RT-detr 航拍图像 多尺度 感受野
在线阅读 下载PDF
基于RT-DETR的轴承表面微小缺陷检测算法
8
作者 周得辉 赵军 程进峰 《计算机应用》 北大核心 2025年第6期1987-1997,共11页
轴承表面缺陷对机电设备的性能和稳定性有显著影响。针对当前轴承表面缺陷检测过程中存在的小目标识别精度不高、速度较慢的问题,提出一种基于RT-DETR(Real-Time DEtection TRansformer)的轴承表面微小缺陷检测算法——FECS-DETR(Faster... 轴承表面缺陷对机电设备的性能和稳定性有显著影响。针对当前轴承表面缺陷检测过程中存在的小目标识别精度不高、速度较慢的问题,提出一种基于RT-DETR(Real-Time DEtection TRansformer)的轴承表面微小缺陷检测算法——FECS-DETR(Faster Expand and Cross hierarchical-scaled feature Screening DETR)算法。首先,采用轻量级FasterNet-T1重构RT-DETR主干网络以降低计算开销;其次,设计内嵌注意力的扩张残差融合(AERF)模块用于提取深层特征,从而增强对小尺度抽象特征的描述能力;再次,通过引入级联分组注意力(CGA),进一步降低计算冗余,并提升模型的运行效率;继次,提出一种跨层级尺度的信息筛选特征金字塔网络(CIS-FPN),以解决特征融合过程中的信息丢失问题,并增强特征融合能力;最后,利用归一化Wasserstein距离(NWD)与改进Inner-MPDIoU联合的回归损失优化策略提高模型收敛速度和模型检测小尺度目标的准确性。实验结果表明,相较于原RT-DETR算法,FECS-DETR算法在轴承表面微小缺陷数据集上的平均精度均值(mAP)提升了2.5个百分点,计算量减少了28.8%,帧率提升了20.8%。可见,所提算法实现了准确率与实时性之间的平衡,能够满足工业环境下的轴承表面微小缺陷检测需求。 展开更多
关键词 轴承表面缺陷检测 小目标 RT-detr 特征金字塔网络 损失函数
在线阅读 下载PDF
基于改进RT-DETR的井下输送带跑偏故障检测算法 被引量:1
9
作者 安龙辉 王满利 张长森 《工矿自动化》 北大核心 2025年第3期54-62,共9页
目前输送带跑偏检测研究主要集中于提取输送带边缘的直线特征,该方式需设定特定阈值,易受环境因素的制约,导致检测速度慢、精度不高。针对该问题,提出了一种基于改进RT-DETR的井下输送带跑偏故障检测算法,使用改进RT-DETR直接对一组托... 目前输送带跑偏检测研究主要集中于提取输送带边缘的直线特征,该方式需设定特定阈值,易受环境因素的制约,导致检测速度慢、精度不高。针对该问题,提出了一种基于改进RT-DETR的井下输送带跑偏故障检测算法,使用改进RT-DETR直接对一组托辊检测,根据左右托辊的暴露程度识别是否跑偏。针对实时检测转换器(RT-DETR)主干网络进行3个方面的改进:①为了减少主干网络的参数量和浮点运算数量(FLOPs),使用FasterNet Block替换ResNet34中的BasicBlock;②为了提升模型的精度和效率,在FasterNet Block结构中,引入结构重参数化的思想;③为了提升FasterNet Block在特征提取方面的性能,引入了高效多尺度注意力机制(EMA),更加有效地捕捉全局和局部特征图。为了拓展感受野并捕获更有效、更广泛的上下文信息,以获得更为丰富的特征表达,采用改进高级筛选特征融合金字塔网络(HS-FPN)来优化多尺度特征融合。实验结果表明,与基准模型相比较,改进RT-DETR模型的参数量和FLOPs分别减少了8.4×10^(6)个和17.8 G,mAP@0.5达94.5%,严重跑偏检测精度达99.2%,检测速度达41.0帧/s,优于TOOD,ATSS等目标检测模型,满足煤矿生产对目标检测实时性和准确性的需求。 展开更多
关键词 输送带跑偏 目标检测 实时检测转换器 结构重参数化 高效多尺度注意力机制 多尺度特征融合
在线阅读 下载PDF
基于RT-DETR的轻量化交通标志检测
10
作者 解浩龙 张孝龙 +1 位作者 魏培旭 崔传金 《应用光学》 北大核心 2025年第2期300-308,共9页
交通标志检测是智能车辆行驶过程中的关键,对于车辆分析路况有着重大的意义。针对现存交通标志检测算法参数较多、精确率不高的问题,提出一种基于改进RT-DETR(real-time detection transformer)的轻量化交通标志检测算法。首先,将模型... 交通标志检测是智能车辆行驶过程中的关键,对于车辆分析路况有着重大的意义。针对现存交通标志检测算法参数较多、精确率不高的问题,提出一种基于改进RT-DETR(real-time detection transformer)的轻量化交通标志检测算法。首先,将模型主干网络中的ResNet网络替换为VanillaNet网络,减少网络的层数与参数量;其次,使用加权双向特征金字塔模型(bi-directional feature pyramid network,BiFPN)代替RT-DETR特征融合模块中的PAN(path aggregation network)结构,增加模型的融合能力,提取更加丰富的特征信息;最后,在特征融合模块中添加GAM(global attention mechanism)注意力机制,加强模型对全局信息的感知,提升多目标与被遮挡目标的检测性能。该算法在交通标志数据集上进行测试,结果说明改进后的RT-DETR算法的mAP(mean average precision)值达到了87.7%,相比原始算法提高了3.6%,且参数减少21%,满足智能车辆设备的部署需要,证明了改进算法的有效性。 展开更多
关键词 机器视觉 detr算法 目标检测 轻量化 注意力机制
在线阅读 下载PDF
基于Transformer算法的智能完井异常检测方法
11
作者 ARANHA Esteves Pedro POLICARPO Angelica Nara SAMPAIO Augusto Marcio 《石油勘探与开发》 北大核心 2025年第4期907-918,共12页
提出了一种多变量石油生产时间序列数据异常检测方法,基于Transformer算法识别智能完井过程中与层段控制阀相关的异常事件,并开展应用实例分析。Transformer算法能够有效处理数据漂移、捕捉复杂规律,因此在时间序列异常检测方面具有显... 提出了一种多变量石油生产时间序列数据异常检测方法,基于Transformer算法识别智能完井过程中与层段控制阀相关的异常事件,并开展应用实例分析。Transformer算法能够有效处理数据漂移、捕捉复杂规律,因此在时间序列异常检测方面具有显著优势;采用的自注意力机制能够使相关模型适应数据分布随时间发生的漂移,从而弹性应对时间序列数据的可能变化;能够高效识别复杂的时间依赖关系和长程交互作用,而传统模型通常难以实现这一功能。在桑托斯盆地盐下油藏超深水井中进行了现场测试,结果表明:模型实现了层段控制阀异常的早期识别,从而最大限度地减少非生产时间并保护井筒完整性;准确率达到0.954 4,平衡准确率为0.969 4,F1分数为0.957 4,与以往研究中采用的模型相比提升显著。 展开更多
关键词 异常检测 智能完井 层段控制阀 井筒完整性 油井监测 深度学习 transformer算法
在线阅读 下载PDF
面向樱桃番茄采摘识别的轻量化Transformer架构优化研究 被引量:4
12
作者 赵博 柳苏纯 +4 位作者 张巍朋 朱立成 韩振浩 冯旭光 王瑞雪 《农业机械学报》 EI CAS CSCD 北大核心 2024年第10期62-71,105,共11页
为进一步提升穗收型樱桃番茄识别准确率和识别速度,实现设施环境番茄自动采摘,提出了一种基于改进Transformer的轻量化樱桃番茄穗态识别模型。首先,构建了包含不同光照环境和采摘姿态的樱桃番茄数据集,并对樱桃番茄果穗姿态进行了划分... 为进一步提升穗收型樱桃番茄识别准确率和识别速度,实现设施环境番茄自动采摘,提出了一种基于改进Transformer的轻量化樱桃番茄穗态识别模型。首先,构建了包含不同光照环境和采摘姿态的樱桃番茄数据集,并对樱桃番茄果穗姿态进行了划分。然后,提出了一种基于改进RE-DETR的轻量化穗收樱桃番茄识别模型,通过引入一个轻量级的骨干网络EfficientViT替换RT-DETR原有的骨干网络,显著减少了模型参数和计算量;同时设计了一个自适应细节融合模块,旨在高效处理并融合不同尺度特征图,并进一步降低计算复杂度。最后,引入加权函数滑动机制和指数移动平均思想来优化损失函数,来处理样本分类中的不确定性。实验结果表明,该轻量化模型在保持高识别准确率(90%)的同时,实现了快速检测(41.2 f/s)和低计算量(8.7×10^(9) FLOPs)。与原始网络模型、Faster R-CNN和Swin Transformer相比,平均识别准确率提高1.24%~15.38%,每秒处理帧数(FPS)提高25.61%~255.17%,同时浮点运算量实现了69.37%~92.37%的大幅降低。该模型在综合性能上有着较强的鲁棒性,兼顾了精度与速度,可为番茄采摘机器人完成视觉任务提供技术支撑。 展开更多
关键词 樱桃番茄 目标检测 深度学习 RT-detr 轻量化 transformer
在线阅读 下载PDF
MSDAB-DETR:一种多尺度遥感目标检测算法 被引量:1
13
作者 李烨 周生翠 张驰 《数据采集与处理》 CSCD 北大核心 2024年第6期1455-1469,共15页
由于遥感图像中的目标尺寸差异大,且捕获不同尺度目标的信息非常困难,因此难以有效识别不同尺度目标。同时,传统Transformer在处理高分辨率图像时会出现计算资源不足的问题;单一的损失计算方式和匈牙利算法结合会增大代价损失的波动性,... 由于遥感图像中的目标尺寸差异大,且捕获不同尺度目标的信息非常困难,因此难以有效识别不同尺度目标。同时,传统Transformer在处理高分辨率图像时会出现计算资源不足的问题;单一的损失计算方式和匈牙利算法结合会增大代价损失的波动性,影响算法的收敛速度和精度。基于上述问题,本文提出一种基于改进DAB-DETR的多尺度遥感目标检测算法(Multi-scale dynamic anchor boxes for DETR, MSDAB-DETR)。首先,该算法通过创建一种新型的多尺度注意力融合模块,利用不同分辨率特征信息之间的差异,实现了对遥感图像的多尺度预测。其次,采用高效注意力机制对Transformer模型中的自注意力机制进行改进,降低原始模型的内存占用量。最后,利用SIoU损失函数作为边界框回归损失,与匈牙利算法相结合,削弱了二分图匹配的波动性,加快了收敛速度,并进一步改善了边界框的回归能力。实验结果表明,该方法在NWPU VHR-10和DIOR数据集上的检测精度分别高达95.3%和71.5%;在NWPU VHR-10数据集上,小、中、大3种尺度目标的平均检测精度相较于DAB-DETR模型分别提升了10.5%、1.8%和2.7%;内存占用量减少约9%。 展开更多
关键词 遥感图像检测 DAB-detr模型 多尺度注意力融合 高效注意力transformer SIoU损失
在线阅读 下载PDF
改进RT-DETR的液晶面板喷墨打印表面缺陷检测
14
作者 李昂 刘竹丽 +1 位作者 宋伟 王立新 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第11期147-154,共8页
液晶面板喷墨打印表面缺陷检测中存在目标小、样本少、纹理背景干扰等问题,应用传统图像处理算法检测精度低、泛化性差,针对以上问题提出了一种改进RT-DETR(real-time detection transformer)的目标检测算法。改进RT-DETR算法通过将主... 液晶面板喷墨打印表面缺陷检测中存在目标小、样本少、纹理背景干扰等问题,应用传统图像处理算法检测精度低、泛化性差,针对以上问题提出了一种改进RT-DETR(real-time detection transformer)的目标检测算法。改进RT-DETR算法通过将主干网络ResNet模型替换为特征提取性能更优的ConvNeXt模型,提高算法整体检测精度。设计了基于通道注意力的增强通道压缩模块,使算法更有效地消除背景干扰专注于定位缺陷目标,加快算法收敛,提高小目标检测精度。在构建的喷墨打印缺陷数据集训练实验上,改进RT-DETR算法检测平均精度mAP(mean average precision)为80.58%,较原始RT-DETR算法提升了2.89%,较原始DETR算法提升了15.88%,检测速度达到20 FPS(frames per second),改进RT-DETR算法的综合检测性能更优。改进RT-DETR算法在小目标检测数据集VisDrone训练实验上表现出良好的通用性,为其他工业场景下的表面小目标缺陷检测提供了参考价值。 展开更多
关键词 表面缺陷检测 目标检测 RT-detr算法 ConvNeXt模型 通道注意力
在线阅读 下载PDF
引入Transformer的道路小目标检测 被引量:1
15
作者 李丽芬 黄如 《计算机工程与设计》 北大核心 2024年第1期95-101,共7页
针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transform... 针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transformer)模块捕获特征内部的相关性,获得上下文信息,提取更加全面丰富的特征;在网络特征融合部分嵌入改进后的空间金字塔池化模块,在保持较小计算量的同时增加特征图的感受野。实验结果表明,在KITTI数据集上,算法检测精度达到91.97%,与YOLOv4算法相比,mAP提高了2.53%,降低了小目标的漏检率。 展开更多
关键词 小目标检测 深度学习 YOLOv4算法 多尺度检测 transformer 空间金字塔池化 特征融合
在线阅读 下载PDF
多尺度局部聚类的Kmeans-DETR目标检测方法 被引量:2
16
作者 崔鹏 杨海峰 +1 位作者 蔡江辉 王玉鹏 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1136-1142,共7页
在利用DETR进行目标检测时,复杂的矩阵运算不仅对稀疏冗余特征产生了大量无效计算,还阻碍了对图像更多尺度信息的使用.针对上述问题,本文提出了多尺度局部聚类的Kmeans-DETR目标检测方法.首先构造了局部Kmeans聚类方法,通过在特征图的... 在利用DETR进行目标检测时,复杂的矩阵运算不仅对稀疏冗余特征产生了大量无效计算,还阻碍了对图像更多尺度信息的使用.针对上述问题,本文提出了多尺度局部聚类的Kmeans-DETR目标检测方法.首先构造了局部Kmeans聚类方法,通过在特征图的局部区域内聚类得到对应簇,并选取特征代表该簇以降低稀疏冗余特征的数量,进而减少矩阵计算量与模型复杂度;其次通过3种尺度的局部聚类,引入多尺度信息的同时通过不同尺度聚类区域重叠的方式解决局部信息不互通的问题;最后改进了位置编码方式用以记录局部聚类后特征的位置信息,并嵌入到簇的代表特征中,利用Transformer结构完成检测任务.本文提出的模型在COCO数据集上与主流的目标检测模型进行了对比,在多个指标上均有较好的表现. 展开更多
关键词 目标检测 Kmeans detr 多尺度 transformer
在线阅读 下载PDF
基于改进YOLOv5s的CNN-Swin Transformer森林野生动物图像目标检测算法 被引量:1
17
作者 杨文翰 刘天宇 +2 位作者 周俊池 胡文武 蒋蘋 《林业科学》 EI CAS CSCD 北大核心 2024年第3期121-130,共10页
【目的】为提高野生动物在复杂森林环境中的检测精度,促进森林野生动物保护技术发展,提出一种基于YOLOv5s网络模型、针对陷阱相机所摄取森林野生动物图像的改进检测算法。【方法】以包含湖南壶瓶山国家级自然保护区几种典型森林野生动... 【目的】为提高野生动物在复杂森林环境中的检测精度,促进森林野生动物保护技术发展,提出一种基于YOLOv5s网络模型、针对陷阱相机所摄取森林野生动物图像的改进检测算法。【方法】以包含湖南壶瓶山国家级自然保护区几种典型森林野生动物在内的数据集为研究对象,首先,对真实标注框图像进行裁剪、归一化和缩放处理,随机将2~4张裁剪图像拼贴组成新的数据集元素,以丰富和增强数据集图像信息;其次,使用一种基于通道注意力思想的加权通道拼接方法,在通道拼接时引入权重改变通道数量,通过反向传播训练方法不断更新权重以增加重要特征信息的通道层数;接着,引入Swin Transformer模块与CNN网络相结合,为卷积神经网络特征提取加入自注意力机制,融合2种网络特征提取层的优势,提高特征提取的感受野;最后,选择更优的α-DIoU损失函数替代GIoU损失函数,针对边界框重叠面积和中心点距离造成的损失,引入新的几何因素惩罚项。【结果】在相同试验条件和数据集下,相比原YOLOv5s网络模型,改进算法极大提高检测的平均准确率和平均回归率,均值平均精度由74.1%提升至88.4%,获得14.3%的精度提升,同时也超过YOLOv3、YOLOXs、RetinaNet、Faster R-CNN等其他流行目标检测算法。【结论】针对陷阱相机所摄取森林野生动物图像背景与目标对比度低、遮挡重叠严重,致使检测误检率、漏检率高等问题,在检测算法中提出一系列改进措施,为我国森林野生动物的保护和数据获取提供一种新的可行性方案和思路。 展开更多
关键词 森林野生动物 检测算法 YOLOv5s Swin transformer 网络融合
在线阅读 下载PDF
基于改进实时检测Transformer的塔机上俯视场景小目标检测模型 被引量:3
18
作者 庞玉东 李志星 +2 位作者 刘伟杰 李天昊 王宁宁 《计算机应用》 CSCD 北大核心 2024年第12期3922-3929,共8页
针对塔机吊钩相互碰撞导致物体跌落以及塔机倒塌致使人员伤亡等一系列施工现场人员安全保障的问题,提出一种基于改进实时检测Transformer(Real-Time DEtection TRansformer,RT-DETR)的塔机上俯视场景小目标检测模型。首先,在原始模型中... 针对塔机吊钩相互碰撞导致物体跌落以及塔机倒塌致使人员伤亡等一系列施工现场人员安全保障的问题,提出一种基于改进实时检测Transformer(Real-Time DEtection TRansformer,RT-DETR)的塔机上俯视场景小目标检测模型。首先,在原始模型中加入应用模型的重参数化思想设计的多路训练和单路推理结构以提升检测速度;其次,重新设计FasterNet Block中的卷积模块替换原始BackBone之中的BasicBlock以提升检测模型性能;再次,利用新的损失函数Inner-SIoU(Inner-Structured Intersection over Union)进一步提升模型精度与收敛速度;最后,进行消融实验与对比实验验证模型性能。结果表明,在检测塔机顶部俯视小目标图像时,所提模型的精度达到94.7%,高于原始RT-DETR模型6.1个百分点;所提模型的每秒检测帧数(FPS)达到59.7,检测速度相较于原模型提升了21%。在公共数据集COCO 2017上所提模型的平均精度(AP)比YOLOv5、YOLOv7和YOLOv8分别高2.4、1.5和1.3个百分点。可见所提模型满足塔机上俯视场景下的小目标检测精度和速度的要求。 展开更多
关键词 目标检测 RT-detr 小目标 transformer 计算机视觉 注意力机制
在线阅读 下载PDF
基于知识蒸馏的轻量化Transformer目标检测 被引量:1
19
作者 王改华 李柯鸿 +4 位作者 龙潜 姚敬萱 朱博伦 周正书 潘旭冉 《系统仿真学报》 CAS CSCD 北大核心 2024年第11期2517-2527,共11页
在自动驾驶领域,目标检测的高效性和准确性尤为重要,基于Transformer结构的目标检测方法逐渐成为主流,省去了复杂的锚点生成和非极大值抑制。针对现有方法计算成本高和收敛速度慢的问题,设计了一种基于池化操作的轻量化Transformer目标... 在自动驾驶领域,目标检测的高效性和准确性尤为重要,基于Transformer结构的目标检测方法逐渐成为主流,省去了复杂的锚点生成和非极大值抑制。针对现有方法计算成本高和收敛速度慢的问题,设计了一种基于池化操作的轻量化Transformer目标检测模型(LPT),包含了池化主干网络和双池化注意力机制,设计了针对DETR(detection transformer)模型的通用知识蒸馏方法,将预测结果、查询向量和教师提取的特征作为知识传递给轻量化的Transformer模型,帮助其提升精确度性能。通过在MS COCO 2017数据集上的实验,验证经过蒸馏的LPT模型在自动驾驶中的应用潜力,实验结果表明:本文方法具有较好的准确性,与一些先进的方法相比具有一定优势。 展开更多
关键词 目标检测 知识蒸馏 轻量化 detr transformer 自动驾驶
在线阅读 下载PDF
基于DeformableDETR的域自适应目标检测模型在城市街道场景中的应用
20
作者 杨浩 陈斌 李科 《计算机应用》 CSCD 北大核心 2024年第S01期262-267,共6页
针对在特定环境背景条件下训练的城市街道目标检测模型直接应用在另一种环境背景条件下城市街道场景中检测性能下降的问题,提出一种基于Deformable DETR(DEtection TRansformer)的域自适应目标检测模型City-DA-DETR,通过引入域自适应模... 针对在特定环境背景条件下训练的城市街道目标检测模型直接应用在另一种环境背景条件下城市街道场景中检测性能下降的问题,提出一种基于Deformable DETR(DEtection TRansformer)的域自适应目标检测模型City-DA-DETR,通过引入域自适应模块融合主干网络特征与Transformer特征,有效实现特征对齐与知识跨域迁移。首先,域自适应模块利用Transformer解码器输出Token与编码器特征交互,生成多尺度实例特征蒙板(MSIM);其次,实例特征蒙板引导Transformer编码器特征生成多尺度空间注意力机制与通道注意力机制;最后,主干网络特征与编码器特征通过注意力机制融合生成用于跨域特征对齐的语义向量。从Cityscape到Fogy-Cityscape数据集,City-DA-DETR模型的平均精度均值(mAP)达到了43.8%,相较于基线模型SFA(Sequence Feature Alignment)提升了2.5百分点;从Sim10K到Cityscape数据集,City-DA-DETR模型的mAP达到了56.1%,相较于SFA提升了3.5百分点。实验结果表明,City-DA-DETR具有良好的域自适应性,有效实现了不同环境背景城市街道场景的跨域迁移。 展开更多
关键词 城市街道场景 detr 目标检测 域自适应 注意力机制
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部