期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于感受野增强和跨尺度融合的SAR舰船检测算法
1
作者 黄应征 刘罡 +1 位作者 闫曙光 侯恩翔 《电光与控制》 北大核心 2025年第4期17-22,43,共7页
针对复杂的海上背景、尺度变化大的船舶目标和噪声干扰导致合成孔径雷达(SAR)舰船检测存在精度不高、漏检和误检严重的问题,提出了一种改进的YOLOv7模型。首先,设计感受野增强特征提取模块(RFEFM),并用其重构主干网络,增强感受野并提高... 针对复杂的海上背景、尺度变化大的船舶目标和噪声干扰导致合成孔径雷达(SAR)舰船检测存在精度不高、漏检和误检严重的问题,提出了一种改进的YOLOv7模型。首先,设计感受野增强特征提取模块(RFEFM),并用其重构主干网络,增强感受野并提高多尺度目标特征提取能力;其次,提出高低维特征融合金字塔(HLF-FPN),过滤干扰的噪声及背景信息,高效融合不同尺度信息;然后,提出一种新的F-MPDIoU损失函数,加快模型收敛,改善了漏检、误检问题;最后,在HRSID数据集上实验,与原YOLOv7模型相比,改进后的模型在mAP@0.5、精确率和召回率方面分别提升了4.9、9.4和13.4个百分点,FPS达到68帧/s,可以满足实时检测的需求。 展开更多
关键词 合成孔径雷达 YOLOv7 感受野增强 跨尺度融合 船舶检测
在线阅读 下载PDF
基于交叉注意和跨尺度融合的车辆抛投垃圾识别
2
作者 陈云腾 孙振华 +1 位作者 周杰忻 刘志 《浙江工业大学学报》 CAS 北大核心 2024年第6期611-620,共10页
旨在实时交通监控视频中智能识别违反车辆投掷垃圾(TWV)行为。TWV不仅污染环境,而且存在大量潜在危险,尤其是在高速隧道场景中,严重影响行车安全。目前,视频中TWV行为仍主要依靠人工方式检查,既耗时又费力。为此,提出了一种基于深度学... 旨在实时交通监控视频中智能识别违反车辆投掷垃圾(TWV)行为。TWV不仅污染环境,而且存在大量潜在危险,尤其是在高速隧道场景中,严重影响行车安全。目前,视频中TWV行为仍主要依靠人工方式检查,既耗时又费力。为此,提出了一种基于深度学习的车辆抛投垃圾识别模型(VTWIM),结合交叉注意和跨尺度融合模型(CASF)、选择性搜索和非最大化抑制(NMS),实现了基于深度剩余网络的车辆垃圾识别方法(CASF-VTWI)。首先,通过选择性搜索将一个视频帧分割为多个区域,这些区域与标有位置框的可疑对象相匹配;然后,利用CASF进行抛掷垃圾的识别训练;最后,利用NMS移除了冗余位置框,保留了最优的位置框。所提方法较好地解决了车辆垃圾的智能识别问题,对实时交通监控视频进行的实验研究证明了模型和算法的有效性与优越性。 展开更多
关键词 车辆抛投垃圾 交叉注意和跨尺度融合 交通监控视频
在线阅读 下载PDF
基于跨尺度特征融合CNN-Transformer神经网络的高压电缆表面缺陷检测
3
作者 魏占朋 许然然 +3 位作者 张华 熊钊 李申童 宋鹏先 《电力系统及其自动化学报》 北大核心 2025年第10期103-110,128,共9页
高压电缆接头剥削质量直接影响电力系统安全运行,准确检测电缆表面微小缺陷是实现电缆接头制备工艺优化与保障电网安全运行的关键技术挑战。为此,结合YOLOv7算法提出基于全局注意力机制与跨尺度特征融合的缺陷检测算法。在主干网络中引... 高压电缆接头剥削质量直接影响电力系统安全运行,准确检测电缆表面微小缺陷是实现电缆接头制备工艺优化与保障电网安全运行的关键技术挑战。为此,结合YOLOv7算法提出基于全局注意力机制与跨尺度特征融合的缺陷检测算法。在主干网络中引入SwinTransformer模块,有效增强模型全局特征提取能力和对微小缺陷的感知能力。通过跨尺度特征融合机制,直接融合不同尺度的特征表示,避免传统特征融合网络存在的信息丢失问题。针对电缆表面缺陷尺寸差异大的特点,采用K-means++算法重新聚类先验框,增强模型的多尺度适应性。实验结果表明,在高压电缆表面缺陷数据集上,所提算法mAP50达到91.6%,较原始YOLOv7算法提升4.5%,其中条纹划痕AP50为88.4%,较原始YOLOv7算法提升4.2%。与FasterR-CNN、YOLOv8、DETR等常用检测方法相比,所提算法mAP50分别提升了8.1%、2.0%、4.8%,实现了电缆表面缺陷的精确检测。 展开更多
关键词 缺陷检测 注意力机制 尺度特征融合 电缆剥削
在线阅读 下载PDF
基于跨尺度特征融合与注意力机制的遥感船舶检测 被引量:1
4
作者 汤永恒 郭璇 +2 位作者 孙水发 李昌振 张晶 《遥感信息》 CSCD 北大核心 2024年第5期29-37,共9页
针对常规目标检测算法对遥感船舶目标检测精度低且预测框不能将船舶目标紧密封装,为后续匹配计算带来极大误差等问题,提出一种跨尺度特征融合与注意力机制的遥感船舶检测算法。该算法通过HRNetV2_w40骨干网络提取高分辨率图像特征,并采... 针对常规目标检测算法对遥感船舶目标检测精度低且预测框不能将船舶目标紧密封装,为后续匹配计算带来极大误差等问题,提出一种跨尺度特征融合与注意力机制的遥感船舶检测算法。该算法通过HRNetV2_w40骨干网络提取高分辨率图像特征,并采用跨尺度融合特征金字塔模块对backbone提取的多级特征信息进行跨级融合,设计卷积注意力网络模块让网络模型在空间和通道两个维度产生注意力特征图信息以生成更加精细化特征图。同时,全新设计融合旋转角度信息的旋转目标损失函数使算法可有效检测任意方向船舶目标。实验结果表明,该算法能有效检测与识别遥感船舶目标,平均准确率达到74.8%,高于现有其他方法。此外,该算法很容易扩展到其他工业领域旋转目标检测任务中。 展开更多
关键词 深度学习 船舶检测 旋转检测 尺度特征融合 卷积注意力
在线阅读 下载PDF
结合跨尺度特征融合与瓶颈注意力模块的轻量型红外小目标检测网络 被引量:9
5
作者 林再平 李博扬 +6 位作者 李淼 王龙光 吴天昊 罗伊杭 肖超 李若敬 安玮 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2022年第6期1102-1112,共11页
提出一种结合跨尺度特征融合与瓶颈注意力模块的轻量型单帧红外小目标检测网络。该网络在不引入额外神经元的前提下,直接在编码层和解码层之间进行高频多尺度特征交互,从而维持小目标在网络深层的响应幅值,实现小目标浅层空间结构特征... 提出一种结合跨尺度特征融合与瓶颈注意力模块的轻量型单帧红外小目标检测网络。该网络在不引入额外神经元的前提下,直接在编码层和解码层之间进行高频多尺度特征交互,从而维持小目标在网络深层的响应幅值,实现小目标浅层空间结构特征与深层高级语义特征之间的交互融合。同时,该网络在编码器瓶颈处级联轻量型混合注意力模块,进一步增强目标特征在网络深层的响应幅值。实验结果表明,该网络能有效抑制复杂背景杂波,并以较低参数量实现红外小目标检测。 展开更多
关键词 红外小目标检测 轻量型算法 跨尺度融合 瓶颈注意力模块
在线阅读 下载PDF
基于跨尺度特征融合自注意力的图像描述方法 被引量:2
6
作者 王鸣展 冀俊忠 +1 位作者 贾奥哲 张晓丹 《计算机科学》 CSCD 北大核心 2022年第10期191-197,共7页
近年来,基于自注意力机制的编码器-解码器框架已经成为主流的图像描述模型。然而,编码器中的自注意力只建模低尺度特征的视觉关系,忽略了高尺度视觉特征中的一些有效信息,从而影响了生成描述的质量。针对该问题,文中提出了一种基于跨尺... 近年来,基于自注意力机制的编码器-解码器框架已经成为主流的图像描述模型。然而,编码器中的自注意力只建模低尺度特征的视觉关系,忽略了高尺度视觉特征中的一些有效信息,从而影响了生成描述的质量。针对该问题,文中提出了一种基于跨尺度特征融合自注意力的图像描述方法。该方法在进行自注意力运算时,将低尺度和高尺度的视觉特征进行跨尺度融合,从视觉角度上提高自注意力关注的范围,增加有效视觉信息,减少噪声,从而学习到更准确的视觉语义关系。在MS COCO数据集上的实验结果表明,所提方法能够更精确地捕获跨尺度视觉特征间的关系,生成更准确的描述。特别地,该方法是一种通用的方法,通过与其他基于自注意力的图像描述方法相结合,能进一步提高模型性能。 展开更多
关键词 图像描述 自注意力 尺度特征融合
在线阅读 下载PDF
抽样切分卷积实现跨尺度特征融合及内镜图像去模糊
7
作者 严靖易 李小霞 +2 位作者 秦佳敏 文黎明 周颖玥 《计算机应用研究》 CSCD 北大核心 2023年第4期1233-1238,共6页
针对内镜图像去模糊过程中语义信息难以提取和细节纹理重建困难的问题,设计了一种新的抽样切分卷积,并将其应用于跨尺度特征融合过程中:通过等间隔抽样将大尺度特征无损切分成小尺度特征块,再与小尺度特征进行卷积融合。过程中大尺度特... 针对内镜图像去模糊过程中语义信息难以提取和细节纹理重建困难的问题,设计了一种新的抽样切分卷积,并将其应用于跨尺度特征融合过程中:通过等间隔抽样将大尺度特征无损切分成小尺度特征块,再与小尺度特征进行卷积融合。过程中大尺度特征的所有值都参与了特征融合,避免了细节信息的丢失;未对小尺度特征进行插值,避免了语义信息的模糊。为进一步实现特征互补,设计了特征交互融合模块,先用语义特征激活细节特征,再将两者融合。针对内镜图像亮通道、中间通道和暗通道的特征差异性设计了梯度重建和频域重建损失函数,提升了重建图像的锐度。在EAD和Kvasir-SEG数据集上,该算法的PSNR分别达到32.88 dB和33.01 dB,SSIM分别达到0.972和0.973。实验结果表明,该算法的性能优于主流去模糊算法,视觉上重建图像的纹理更清晰,且未产生伪影。 展开更多
关键词 内镜图像重建 抽样切分卷积 去模糊 尺度特征融合 损失函数
在线阅读 下载PDF
基于多尺度注意力机制的无人机小目标检测算法 被引量:2
8
作者 冯迎宾 郭枭尊 晏佳华 《兵工学报》 北大核心 2025年第1期12-21,共10页
针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster ... 针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster Block_C2f,EF_C2f),替换YOLOv8网络中的C2f模块,提高网络对小目标特征的提取能力;在特征融合网络中增加P1检测层,并设计一种跨尺度特征融合结构(Bi-Path Aggregation Network,BPAN),融合小目标特征信息;增加一个微小目标检测头,使用SIoU Loss作为边界框损失函数,提升小目标检测精度和网络收敛速度。在公开数据集VisDrone2019上进行实验验证。验证结果表明:与YOLOv8s算法相比,新算法在检测精度上提升了6.9%、mAP50提升了9.1%,模型参数量减少了44.6%,检测速度为28帧/s,新算法在小目标检测领域具有一定的实用性。 展开更多
关键词 尺度注意力机制 YOLOv8s算法 特征提取 尺度特征融合 小目标检测
在线阅读 下载PDF
基于Transformer的全局-局部融合特征的遮挡行人重识别方法
9
作者 汪旭 胡晓光 +1 位作者 付哲宇 赵利欣 《计算机科学与探索》 北大核心 2025年第7期1832-1850,共19页
行人重识别(ReID)是利用人工智能解决车站安检、城市监控系统等公共安全应用问题的技术,具有从跨设备采集的图像中识别某一特定行人的能力。但是在行人重识别等问题中,往往会出现行人被刻意遮挡或被复杂场景环境遮挡等因素,这大大增加... 行人重识别(ReID)是利用人工智能解决车站安检、城市监控系统等公共安全应用问题的技术,具有从跨设备采集的图像中识别某一特定行人的能力。但是在行人重识别等问题中,往往会出现行人被刻意遮挡或被复杂场景环境遮挡等因素,这大大增加了行人重识别的难度。在目前所提出的大部分遮挡行人重识别方法中,卷积神经网络模型更加关注局部特征,但难以获得全局结构信息,Transformer网络模型建模长距离的特征依赖,但易忽略局部特征细节。为解决这些难题,提出了一种全局-局部融合特征的遮挡行人重识别方法,利用CNN和Transformer特征学习网络的特点,在丰富行人局部特征的同时提升特征的全局表达能力。该模型由三个部分组成:CNN网络主要提取局部细节特征,Transformer分支侧重提取全局特征信息,并通过跨维度多尺度池化融合模块计算上述两个分支特征的相关性,进而实现全局-局部的特征融合;由多层级注意力引导生成的掩码模块能够精准地突出行人图像中的关键特征,自动对齐行人特征信息,抑制遮挡部分或背景噪声的干扰;图像高低频特征增强模块强化被遮挡行人的高低频特征信息,突出有效信息。消融实验以及在相关数据集上的实验结果证明了所提方法的有效性。 展开更多
关键词 全局 局部 维度多尺度池化融合 多层级注意力 高低频特征
在线阅读 下载PDF
基于注意机制和多尺度跨模态融合的RGB-D显著性检测
10
作者 崔志强 冯正勇 +1 位作者 王峰 刘强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第6期893-902,共10页
针对基于深度卷积神经网络的RGB-D显著性检测性能差等问题,提出利用注意机制和多尺度跨模态融合进行RGB-D显著性检测的方法.首先采用多尺度残差注意模块对骨干网络提取的特征进行预处理;然后提出多尺度跨模态融合策略,对高层RGB特征和... 针对基于深度卷积神经网络的RGB-D显著性检测性能差等问题,提出利用注意机制和多尺度跨模态融合进行RGB-D显著性检测的方法.首先采用多尺度残差注意模块对骨干网络提取的特征进行预处理;然后提出多尺度跨模态融合策略,对高层RGB特征和深度特征进行融合,获得初始显著图;最后采用边界细化模块细化初始显著图中目标的边界,使最终显著图包含敏锐的边界和完整的突出目标.在5个基准数据集上与10种先进方法进行实验的结果表明,所提方法在4个评价指标上均处于前3名;尤其是在NJUD和SIP数据集上,该方法在4个指标上提升了0.5%~1.5%. 展开更多
关键词 图像处理 显著性检测 注意机制 尺度模态融合
在线阅读 下载PDF
基于提案增强的解耦特征挖掘旋转检测器
11
作者 赵振博 付天怡 +1 位作者 董红斌 张小平 《智能系统学报》 北大核心 2025年第5期1123-1135,共13页
小而杂乱的物体交织在一起,在遥感图像中尤为常见,给目标检测带来了巨大挑战。在旋转目标检测任务中这个困难更加突出。鉴于此,本文提出了基于提案增强的解耦特征挖掘旋转检测器(decoupled feature mining rotational detector based on... 小而杂乱的物体交织在一起,在遥感图像中尤为常见,给目标检测带来了巨大挑战。在旋转目标检测任务中这个困难更加突出。鉴于此,本文提出了基于提案增强的解耦特征挖掘旋转检测器(decoupled feature mining rotational detector based on proposal enhancement,PDMDet)。首先,采用单阶段检测器取代两阶段检测器的提案生成网络,通过生成高质量提案以减少背景冗余。其次,在相同维度使用自注意力,不同维度使用交叉注意力,通过对相同维度特征增强,不同维度特征交错融合提升检测器对不同尺寸目标的识别能力。最后,鉴于分类和定向边界框回归任务对特征的敏感性不同,本文提出解耦特征细化处理两个不同任务。通过实验,PDMDet在DOTA-v1.0、DOTA-v1.5和HRSC2016这3个数据集上分别取得单尺度78.37%、72.35%、98.60%的平均精度均值,检测准确率高于其他算法,在复杂的旋转目标检测场景具有一定的竞争力。 展开更多
关键词 遥感图像 目标检测 旋转目标检测 小目标 高密度 倾斜边界框 跨尺度融合 两阶段检测器
在线阅读 下载PDF
面向鱼眼相机标定和畸变处理的深度神经网络
12
作者 李晗 葛动元 姚锡凡 《科学技术与工程》 北大核心 2025年第17期7260-7267,共8页
针对鱼眼相机的传统标定过程烦琐并且不适用于日常场景图像的问题,提出了一种新的基于卷积神经网络的方法,可同时标定鱼眼镜头的内参并进行图像畸变校正。该方法通过预测不同畸变参数下像素点的位移量,从而提高鱼眼相机标定和图像畸变... 针对鱼眼相机的传统标定过程烦琐并且不适用于日常场景图像的问题,提出了一种新的基于卷积神经网络的方法,可同时标定鱼眼镜头的内参并进行图像畸变校正。该方法通过预测不同畸变参数下像素点的位移量,从而提高鱼眼相机标定和图像畸变校正的精度;为了进一步提高模型精度和泛化性,在编码部分引入坐标注意力模块,增强对图像位置信息的关注度;最后为了增强图像的细节特征,在跨越连接部分设计了跨尺度融合模块。针对数据集稀缺的问题,还生成了一个新的大规模数据集,标有相应的畸变参数和畸变校正后的图像。实验结果表明:与其他鱼眼相机标定方法相比,重投影误差为0.312 pixel,标定的精度较高;与图像畸变处理方法相比,峰值信噪比(peak signal to noise ratio,PSNR)为38.055 dB,结构相似度(structural similarity,SSIM)为0.874,图像畸变校正的质量较好。 展开更多
关键词 鱼眼相机标定 畸变处理 坐标注意力模块 跨尺度融合模块
在线阅读 下载PDF
煤矿井下暗光环境人员行为检测研究 被引量:1
13
作者 董芳凯 赵美卿 黄伟龙 《工矿自动化》 北大核心 2025年第1期21-30,144,共11页
煤矿井下环境复杂,对部分作业现场人员行为进行检测时易出现漏检与误检问题。针对该问题,提出了一种煤矿井下暗光环境人员行为检测方法,包括暗光环境图像增强和行为检测2个部分。暗光环境图像增强基于自校准光照学习(SCI)进行改进,由图... 煤矿井下环境复杂,对部分作业现场人员行为进行检测时易出现漏检与误检问题。针对该问题,提出了一种煤矿井下暗光环境人员行为检测方法,包括暗光环境图像增强和行为检测2个部分。暗光环境图像增强基于自校准光照学习(SCI)进行改进,由图像增强网络和校准网络构成。人员行为检测通过引入Dynamic Head检测、跨尺度融合模块和Focal-EIoU损失函数来改进YOLOv8n模型。SCI+网络增强后的图像作为人员行为检测模型检测的对象,完成井下暗光环境人员行为的检测任务。实验结果表明:(1)井下暗光环境人员行为检测方法的m AP@0.5为87.6%,较YOLOv8n提升了2.5%,较SSD,Faster RCNN,YOLOv5s,RT-DETR-L分别提升了15.7%,11.5%,0.9%,4.3%。(2)井下暗光环境人员行为检测方法的参数量为3.6×106个,计算量为11.6×109,检测速度为95.24帧/s。(3)在公开数据集EXDark上,井下暗光环境人员行为检测方法的mAP@0.5为74.7%,较YOLOv8n提升了1.5%,表明该方法具有较强的泛化能力。 展开更多
关键词 暗光环境 井下人员行为检测 自校准光照学习 图像增强 SCI+网络 Dynamic Head 跨尺度融合模块 Focal-EIoU损失函数 YOLOv8n
在线阅读 下载PDF
基于改进YOLOv9的路面病害检测模型 被引量:2
14
作者 刘文浩 张登银 《中国测试》 北大核心 2025年第7期19-29,共11页
针对路面病害检测任务中现存的病害尺寸差异大以及细小病害特征提取困难的问题,该文以YOLOv9网络模型为基础,首先,引入尺度内特征交互AIFI模块,以提供更全面的信息理解以及更深层次的特征提取;其次,引入跨尺度特征CCFF模块,以提高模型... 针对路面病害检测任务中现存的病害尺寸差异大以及细小病害特征提取困难的问题,该文以YOLOv9网络模型为基础,首先,引入尺度内特征交互AIFI模块,以提供更全面的信息理解以及更深层次的特征提取;其次,引入跨尺度特征CCFF模块,以提高模型对目标尺寸变化的适应性;最后,引入Focaler-IoU边界回归损失函数,以减少困难样本和易处理样本分布对边界框回归的影响。该方法在RDD2022的中国区域数据集上进行多组实验,实验结果显示:改进后的模型相较于原YOLOv9模型在帧率损失不大的情况下,平均精度均值有3.3%的提升,精度提升3.5%,召回率提高4.6%。一系列实验结果表明,该文所提出的方法在路面病害检测任务中检测效果更好。 展开更多
关键词 路面病害检测 尺度特征融合 YOLOv9
在线阅读 下载PDF
动态上下文感知及残差注意力食管癌病变分割
15
作者 丁楠 李小霞 +5 位作者 曹耀丹 毛艳会 何琴 姜坤元 程杰 周颖玥 《计算机工程与应用》 北大核心 2025年第22期257-266,共10页
针对食管早癌及癌前病变区域细粒度分割中出现的类间差异小、类内差异大和边缘模糊等问题,提出一种动态上下文感知残差注意力网络。使用金字塔视觉Transformer v2(pyramid vision transformer v2,PVTv2)作为特征提取网络设计PVT分支,提... 针对食管早癌及癌前病变区域细粒度分割中出现的类间差异小、类内差异大和边缘模糊等问题,提出一种动态上下文感知残差注意力网络。使用金字塔视觉Transformer v2(pyramid vision transformer v2,PVTv2)作为特征提取网络设计PVT分支,提取主要的特征表示,再通过残差块的堆叠设计残差注意力全卷积分支,对细节特征进行补充。在全卷积分支的编码器上设计动态残差注意力特征增强模块,在强化重要特征表示的同时,保留编码器每个阶段的初始图像信息。在PVT分支的解码阶段设计动态上下文特征感知引导模块,利用多尺度特征引导局部与全局信息的动态融合,实现自适应的渐进解码过程,在保留细节信息的同时,加深对全局上下文的理解。分别在自建食管癌数据集,公开数据集Kvasir-SEG、CVC-ClinicDB和ISIC2018上进行验证,实验结果表明,相似系数分别达到了74.92%、95.79%、96.83%和92.89%,优于主流分割网络。 展开更多
关键词 医学图像分割 动态注意力 尺度特征融合 上下文感知
在线阅读 下载PDF
基于YOLOv10n的BGA锡球缺陷检测算法
16
作者 胡彬 朱文彬 +1 位作者 王鸣昕 朱晓春 《半导体技术》 北大核心 2025年第10期1067-1077,共11页
球栅阵列(BGA)锡球缺陷的高效检测是保障芯片质量的核心环节,而缺陷样本的稀缺性为基于深度学习方法的有效训练带来了挑战。设计了一种基于前景-背景加权融合的数据增强方法,有效缓解了训练样本的不足,并提出了一种基于YOLOv10n的BGA锡... 球栅阵列(BGA)锡球缺陷的高效检测是保障芯片质量的核心环节,而缺陷样本的稀缺性为基于深度学习方法的有效训练带来了挑战。设计了一种基于前景-背景加权融合的数据增强方法,有效缓解了训练样本的不足,并提出了一种基于YOLOv10n的BGA锡球缺陷检测算法EMP-YOLOv10n。首先,构建跨尺度高效特征融合网络(EffiFuseNet),在减少参数量(Params)的同时,增强对缺陷细节的捕捉能力;其次,引入一种新型C2f_MLCA模块,以提高对小目标缺陷的检测精度;最后,提出一种轻量化检测头(P-Detect)模块,在保留有效信息的同时显著减小了计算量。实验结果显示,与基准模型YOLOv10n相比,EMP-YOLOv10n的平均精度均值(mAP)提高了3.4%,召回率(R)提高了6%,Params减少了42.3%,计算复杂度降低了34.1%,这表明该模型有效提高了基于深度学习的BGA锡球缺陷检测的准确性和实时性。 展开更多
关键词 球栅阵列(BGA) 锡球 缺陷检测 数据增强 尺度高效特征融合网络(EffiFuseNet) C2f_MLCA模块 小目标检测
在线阅读 下载PDF
基于YOLOv8-S的偏光片表面缺陷检测算法
17
作者 盛威 周永霞 +1 位作者 陈俊杰 赵平 《计算机工程与应用》 北大核心 2025年第6期128-140,共13页
随着偏光片市场不断扩大,应用愈发广泛,对偏光片的生产要求也愈加严格。针对在偏光片表面缺陷检测中,存在缺陷形态复杂、小尺寸缺陷容易误检漏检的问题,提出一种基于YOLOv8-S偏光片表面缺陷检测改进算法。使用DCNv3替换主干网C2f模块中... 随着偏光片市场不断扩大,应用愈发广泛,对偏光片的生产要求也愈加严格。针对在偏光片表面缺陷检测中,存在缺陷形态复杂、小尺寸缺陷容易误检漏检的问题,提出一种基于YOLOv8-S偏光片表面缺陷检测改进算法。使用DCNv3替换主干网C2f模块中的普通卷积,同时结合EMA注意力机制,构建DEC2f特征提取模块,提升主干网对复杂缺陷的特征提取能力。基于特征细化模块构建轻量跨尺度特征细化融合模块(LCFRFM),提升通道净化能力并降低参数量,有效跨尺度融合主干网浅层特征。引入ConvMixer Layer构建CMC2f预测头,更大的预测视野带来更强的小尺寸缺陷检测能力。使用SIoU替换CIoU作为边界框回归损失函数,使用AdamW替换SGD作为网络训练时的优化器,提升检测精度和训练收敛速度。实验结果表明,该算法相比YOLOv8-S在mAP50和mAP50:95上分别提升了2.4和2.9个百分点,证明了提出算法的有效性。 展开更多
关键词 偏光片表面 缺陷检测 特征提取 尺度特征融合 YOLOv8
在线阅读 下载PDF
全局-局部注意力引导的红外图像恢复算法
18
作者 刘晓朋 张涛 《红外技术》 CSCD 北大核心 2024年第7期791-801,共11页
针对真实世界的红外图像恢复算法中存在的图像模糊、纹理失真、参数过大等问题,提出了一种用于真实红外图像的全局-局部注意力引导的超分辨率重建算法。首先,设计了一种跨尺度的全局局部特征融合模块,利用多尺度卷积和Transformer并行... 针对真实世界的红外图像恢复算法中存在的图像模糊、纹理失真、参数过大等问题,提出了一种用于真实红外图像的全局-局部注意力引导的超分辨率重建算法。首先,设计了一种跨尺度的全局局部特征融合模块,利用多尺度卷积和Transformer并行融合不同尺度的信息,并通过可学习因子引导全局和局部信息的有效融合。其次,提出了一种新颖的退化算法,即域随机化退化算法,以适应真实红外场景图像的退化域。最后,设计了一种新的混合损失函数,利用权重学习和正则化惩罚来增强网络的恢复能力,同时加快收敛速度。在经典退化图像和真实场景红外图像上的测试结果表明,与现有方法相比,该算法恢复的图像纹理更逼真,边界伪影更少,同时参数总数最多可减少20%。 展开更多
关键词 域随机化退化算法 跨尺度融合 红外图像超分辨率 生成对抗网络
在线阅读 下载PDF
基于改进Deformable DETR的无人机视频流车辆目标检测算法 被引量:4
19
作者 江志鹏 王自全 +4 位作者 张永生 于英 程彬彬 赵龙海 张梦唯 《计算机工程与科学》 CSCD 北大核心 2024年第1期91-101,共11页
针对无人机视频流检测中小目标数量多、因图像传输质量较低而导致的上下文语义信息不充分、传统算法融合特征推理速度慢、数据集类别样本不均衡导致的训练效果差等问题,提出一种基于改进Deformable DETR的无人机视频流车辆目标检测算法... 针对无人机视频流检测中小目标数量多、因图像传输质量较低而导致的上下文语义信息不充分、传统算法融合特征推理速度慢、数据集类别样本不均衡导致的训练效果差等问题,提出一种基于改进Deformable DETR的无人机视频流车辆目标检测算法。在模型结构方面,该算法设计了跨尺度特征融合模块以增大感受野,提升小目标检测能力,并采用针对object_query的挤压-激励模块提升关键目标的响应值,减少重要目标的漏检与错检率;在数据处理方面,使用了在线困难样本挖掘技术,改善数据集中类别样本分布不均的问题。在UAVDT数据集上进行了实验,实验结果表明,改进后的算法相较于基线算法在平均检测精度上提升了1.5%,在小目标检测精度上提升了0.8%,并在保持参数量较少增长的情况下,维持了原有的检测速度。 展开更多
关键词 Deformable DETR 目标检测 尺度特征融合模块 object query挤压-激励 在线难样本挖掘
在线阅读 下载PDF
结合目标色彩特征的基于注意力的图像分割
20
作者 张建兴 李军 石庆龙 《计算机工程与应用》 CSCD 2014年第13期191-195,共5页
提出一种基于注意力的图像分割算法,在视觉场景选择机制基础上结合目标色彩特征的任务驱动机制,形成了自下而上和自上而下的注意力集成分割机理。该算法在图像的多尺度空间中,把视觉场景的亮度、颜色和方向特征与任务目标色彩特征同时... 提出一种基于注意力的图像分割算法,在视觉场景选择机制基础上结合目标色彩特征的任务驱动机制,形成了自下而上和自上而下的注意力集成分割机理。该算法在图像的多尺度空间中,把视觉场景的亮度、颜色和方向特征与任务目标色彩特征同时进行提取,生成场景和目标相结合的显著图,然后在基于视觉注意力图像空间中对"场景-目标"显著图进行归一化的跨尺度融合,最后通过双线性插值和显著图连通区域二值化分割出图像目标注意力焦点。应用该算法对自然场景与室内场景图像进行实验,结果表明该方法在各种环境中尤其是干扰物体较显著的情形下都能成功地分割提取出目标物体。 展开更多
关键词 图像分割 注意力 特征图 场景-目标显著图 跨尺度融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部