期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
基于改进Swin Transformer的人脸活体检测 被引量:2
1
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 Swin Transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
CSD-YOLOv8的输电线路故障目标检测
2
作者 马旭 王锐 +6 位作者 邓军 常驰 郝帅 李添麒 刘峥岐 李国亮 赵晴 《西安科技大学学报》 北大核心 2025年第2期383-392,共10页
针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入... 针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入空间金字塔池化将不同尺度特征进行融合;然后,在检测网络头部中引入深度可分离卷积,并将其与交叉卷积连接模块结合,实现对部分遮挡目标的准确检测;此外,设计基于通道注意力机制的特征融合模块对不同层级特征进行加权融合,提高复杂背景下故障目标特征信息提取能力;最后,利用某电力巡检部门近5年的巡检数据对所提出算法进行验证。结果表明:相比于4种经典对比算法,所提方法在对12种故障类型检测效果的综合指标最好,平均检测精度为94.7%,召回率为93.0%。与此同时,所提算法具有较好的实时性,对于分辨率为1280×720的图像检测速度为45帧/s,为输电线路的智能巡检奠定了坚实的理论基础。 展开更多
关键词 YOLOv8 多尺度检测 通道注意力机制 特征融合 深度可分离模块
在线阅读 下载PDF
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
3
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
多尺度融合增强与注意力机制结合的图像语义分割
4
作者 刘书刚 杜昊东 王洪涛 《计算机应用与软件》 北大核心 2025年第6期225-233,278,共10页
针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特... 针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特征信息进行融合,在解码器末端使用改进的轻量化卷积注意力模块,使得对于物体边界分割更加充分。通过在Pascal VOC2007和Cityscapes数据集上进行实验验证,结果表明该方法较原有网络的精确度有显著的提高。 展开更多
关键词 语义分割 特征融合增强 注意力模块 编码器 上采样
在线阅读 下载PDF
基于改进TransUNet的肺部图像分割
5
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
基于深度学习的车道线检测算法
6
作者 岳永恒 赵志浩 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期22-30,共9页
针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现... 针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现图像的多尺度特征提取;接着,网络框架中设计多尺度空间注意力模块,且引入SimAM轻量级注意力机制,以增强对目标特征的聚焦能力;然后,设计自适应特征融合模块,通过智能调整不同尺度特征图的融合权重,对PANet输出的特征图进行跨尺度融合,以提升网络对复杂特征的提取能力。在TuSimple数据集上的实验结果表明,所提算法的检测精度为96.84%,较原算法提升了1.02个百分点,优于传统的主流算法;在CULane数据集上的实验结果表明,所提算法的F_(1)值为72.74%,优于传统的主流算法,较原算法提升了4.34个百分点,尤其在强光和阴影等极端场景下的检测性能提升显著,说明所提算法在复杂场景下具有优异的检测能力;实时性测试结果显示,所提算法的推理速度达118.0 f/s,满足智能车辆的实时性需求。 展开更多
关键词 车道线检测 深度学习 多尺度空间注意力机制 自适应特征融合
在线阅读 下载PDF
基于特征分治与融合的铁路扣件轻量化实时检测模型
7
作者 鄢化彪 林初欣 +3 位作者 黄绿娥 李东丽 刘词波 徐方奇 《北京交通大学学报》 北大核心 2025年第3期56-67,共12页
为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景... 为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景对目标的干扰;其次,提出一种二重分治特征融合方法,提升对不同大小目标的检测能力,同时在检测头(YOLO Head)的代价体构建方面,引入可变焦距损失函数(Varifocal Loss,VFL)代替YOLOX-Nano检测头的二值交叉熵损失函数,提高轻量化实时检测的精度;再次,使用随机Alpha-IoU(RAL)损失函数动态调整参数,延缓算法的收敛速度从而优化模型的训练曲线,避免模型训练过程陷入局部最优解;最后,采集10233个检测目标并划分为6种类型,选择YOLOX-Nano、Faster R-CNN及YOLOv8n等主流目标检测模型作为对比进行实验.实验结果表明:所提模型的每秒帧数(Frames Per Second,FPS)为60.24,平均精度(Average Precision,AP)为83.40%,较基线模型提高了3.24%;参数量为2.31 M,较YOLOX-Tiny减少54.08%,浮点数计算量为1.99 G,较YOLOX-Tiny减少69.15%.研究成果可为轻量级实时检测模型与计算系统提供参考. 展开更多
关键词 轻量级嵌入式系统 分治混合注意力模块 分治特征融合 代价体构建
在线阅读 下载PDF
改进YOLOv7-Tiny的道路裂缝检测算法 被引量:3
8
作者 王启涵 刘超 《计算机工程与应用》 北大核心 2025年第10期372-380,共9页
道路裂缝检测是道路工程中的重要环节。针对现阶段道路裂缝检测算法中准确度低、效率低的问题,提出了一种基于YOLOv7-Tiny的轻量型道路裂缝检测算法YOLOv7-TPSF。引入部分卷积PConv,对原网络中耗参量较多的3×3卷积层进行部分替换,... 道路裂缝检测是道路工程中的重要环节。针对现阶段道路裂缝检测算法中准确度低、效率低的问题,提出了一种基于YOLOv7-Tiny的轻量型道路裂缝检测算法YOLOv7-TPSF。引入部分卷积PConv,对原网络中耗参量较多的3×3卷积层进行部分替换,降低模型的参数量,提升模型的训练速度;结合特征融合网络BiFusion Neck与加权特征金字塔BiFPN的优点,提出了新的特征融合模块Bi-FusFPN,减少网络计算量,强化多尺度特征的融合能力;在输出端添加无参注意力机制SimAM,进一步提高大、中、小三类目标的检测能力。实验结果表明,YOLOv7-TPSF算法相较于YOLOv7-Tiny算法,网络参数量与计算量分别减少了31.7%、34.6%,准确度与检测速度分别提高了3.7%、9.7%,一定程度上满足了道路裂缝检测准确性与实时性的需求。 展开更多
关键词 道路裂缝检测 YOLOv7-Tiny 轻量型 注意力机制 特征融合模块Bi-FusFPN
在线阅读 下载PDF
基于Ghost卷积与自适应注意力的点云分类 被引量:1
9
作者 舒密 王占刚 《现代电子技术》 北大核心 2025年第6期106-112,共7页
点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,... 点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,提出一种基于点云Transformer的轻量级特征增强融合分类网络EFF-LPCT。EFF-LPCT使用一维化Ghost卷积对原始网络进行重构,以降低计算复杂度和内存要求;引入自适应支路权重,以实现注意力层级间的多尺度特征融合;利用多个通道注意力模块增强特征的通道交互信息,以提高模型分类效果。在ModelNet40数据集进行的实验结果表明,EFF-LPCT在达到93.3%高精度的同时,相较于点云Transformer减少了1.11 GFLOPs的浮点计算量和0.86×10^(6)的参数量。 展开更多
关键词 点云分类 Transformer网络 Ghost卷积 特征增强融合模块 ECA通道注意力 特征学习
在线阅读 下载PDF
基于联合学习和多级小波特征金字塔的MRI-TRUS图像配准方法
10
作者 蒋宏贵 胡冀苏 +3 位作者 钱旭升 郑毅 周志勇 戴亚康 《计算机工程》 北大核心 2025年第10期270-283,共14页
磁共振图像(MRI)和经直肠超声(TRUS)图像的配准是将术前MRI配准在超声图像上,结合两种模态图像的优势,快速定位病灶区域,在辅助诊断、穿刺、术中导航等医学手术中起重要作用。由于这两种图像模式之间固有的表征差异,具有显著的强度失真... 磁共振图像(MRI)和经直肠超声(TRUS)图像的配准是将术前MRI配准在超声图像上,结合两种模态图像的优势,快速定位病灶区域,在辅助诊断、穿刺、术中导航等医学手术中起重要作用。由于这两种图像模式之间固有的表征差异,具有显著的强度失真和变形,因此在这两种图像模式之间寻找精确的密集对应关系面临较大挑战。为此,提出一种基于联合学习和多级小波特征金字塔(MWFP)的弱监督可变形配准网络框架,对MRI和TRUS图像进行对齐。联合学习是基于预训练的半监督分割网络和配准网络组成的框架,在联合学习框架中分割网络和配准网络继续交替训练,分割网络为配准网络提供前列腺标签约束全局配准,有效解决了配准网络中标签不足的问题。MWFP是采用多分辨小波构成的配准网络,小波金字塔生成的多尺度图像过滤了噪声并减小了两种模式图像之间的表征差异,提高配准网络学习多尺度特征的能力,并在配准网络中设计多尺度特征融合注意力(MSFFA)模块,对特征进行更进一步筛选,为配准提供局部密集对应关系。此外,配准网络提供的形变分割图像和分割标签混合原有的人工标注标签和图像及其分割网络生成的伪标签和其图像放入分割网络继续训练,进一步提高多模态图像分割的性能。在642例公开前列腺MRI和TRUS图像活检数据集上的实验结果表明,所提的配准方法达到最优的Dice相似系数(DSC)值、95%Hausdorff距离(HD95)、互信息(MI)值和结构相似性(SSIM)值,分别是81.05%±1.77%、12.83±1.49 mm、18.12%±4.63%和27.12%±4.63%,优于对比的传统配准方法和先进的深度学习配准方法。此外,所提方法的平均配准时间为0.18±0.02 s,比传统的方法提升了近400倍。所提的配准方法能够准确实时地估计前列腺MRI和TRUS图像之间的形变场,具有更高的配准精度和更快的配准速度。 展开更多
关键词 联合学习 多级小波特征金字塔 可变形配准 多尺度特征融合注意力模块 半监督分割
在线阅读 下载PDF
驾驶素质缺失测试眼状态的深度学习分类方法研究
11
作者 杨旺达 万亚平 +3 位作者 邹刚 闵晓珊 王沂 陆宇程 《计算机工程》 北大核心 2025年第2期149-158,共10页
由驾驶员的不安全行为导致的交通事故占多数,针对驾驶认知素质特性的研究,搭建虚拟驾驶场景评估驾驶者的驾驶素质,可以最大限度地贴近现实环境和操作,唤醒驾驶者的潜在驾驶能力和应对能力。眼球运动可以极大程度地反映出驾驶者的认知状... 由驾驶员的不安全行为导致的交通事故占多数,针对驾驶认知素质特性的研究,搭建虚拟驾驶场景评估驾驶者的驾驶素质,可以最大限度地贴近现实环境和操作,唤醒驾驶者的潜在驾驶能力和应对能力。眼球运动可以极大程度地反映出驾驶者的认知状态,但目前多数眼动状态识别研究主要关注在自然状态中基本视觉运动方向或者眼睑的闭合,识别类别的能力和效果对于驾驶场景的认知状态评估有限。收集了10类静态眼动方向的双眼数据,并提出融合注意力机制的多尺度眼状态图像识别模型。首先,使用部分卷积设计双分支特征融合模块,在加强模型特征提取能力的同时减少计算冗余;然后,在双分支特征融合的残差模块中嵌入改进的坐标注意力(CA)机制,提升模型对不同尺度特征的信息表征能力;最后,对模型的通道结构和数量进行调整,平衡模型的参数量与识别准确率。实验结果表明,所提方法在构建的10类眼动状态数据集上识别准确率达到95.1%,相比改进前的网络提高3.4个百分点;在Eye Chimera数据集和MRL眼睛数据集上的识别准确率分别为95.1%和98.95%,可以满足在虚拟驾驶测试环境下眼动状态识别的要求,并为进一步结合多参数分析驾驶素质缺失任务奠定基础。 展开更多
关键词 驾驶认知 眼状态 图像分类 特征融合 注意力模块
在线阅读 下载PDF
基于特征融合与RCB⁃EffcientNet网络的校园安全声检测方法
12
作者 孙凯玮 王玫 +3 位作者 阚瑞祥 刘鑫 仇洪冰 林桂耀 《现代电子技术》 北大核心 2025年第7期79-84,共6页
声音分类技术在校园事件监测中至关重要。然而,声音识别领域存在诸多挑战,如特征提取方法的适配性不足、现有方法难以平衡学习、理解能力与模型复杂度之间的关系等。为解决这些问题,文中提出一种基于LM⁃H声学特征和RCB⁃EfficientNet模... 声音分类技术在校园事件监测中至关重要。然而,声音识别领域存在诸多挑战,如特征提取方法的适配性不足、现有方法难以平衡学习、理解能力与模型复杂度之间的关系等。为解决这些问题,文中提出一种基于LM⁃H声学特征和RCB⁃EfficientNet模型的改进算法。从原始音频中提取Log⁃Mel和Hilbert谱图特征,融合为全新的LM⁃H特征来描述校园异常声,并提出轻量化音频分类模型RCB⁃EfficientNet。通过减少主要模块的堆叠和模型参数量,并添加特征层间的跳跃连接保证信息传递,同时通过替换注意力模块来避免信息丢失。最后,在基于数个公开数据集重组而成的自建数据集上进行实验,改进后的模型参数量为2.69 MB,减少了1.32 MB,总体下降32%,同时实现了98.70%的精度。证实了该改进算法在维持轻量级计算的同时,具有高准确性和稳健性。 展开更多
关键词 声音分类 特征融合 校园异常声 声学特征 轻量化 注意力模块
在线阅读 下载PDF
基于PvIR-DCANet的光伏组件红外图像缺陷检测
13
作者 吕晓杰 潘威 +2 位作者 汪帆 柴绍博 田易之 《智慧电力》 北大核心 2025年第8期105-113,共9页
针对可见光图像在光伏组件缺陷检测中因光照不均与反射干扰导致精度下降的问题,提出一种基于坐标注意力与双向特征融合的光伏红外图像缺陷检测网络PvIR-DCANet。该网络在骨干网络中引入坐标注意力机制(CAM),增强对细微缺陷的检测能力;... 针对可见光图像在光伏组件缺陷检测中因光照不均与反射干扰导致精度下降的问题,提出一种基于坐标注意力与双向特征融合的光伏红外图像缺陷检测网络PvIR-DCANet。该网络在骨干网络中引入坐标注意力机制(CAM),增强对细微缺陷的检测能力;设计双向密集特征金字塔网络(BDFPN),强化多尺度特征融合以提升不同尺度缺陷的检测性能;同时采用SIoU损失函数优化密集小尺度缺陷目标的定位精度。实验结果表明,PvIR-DCANet的mAP达92.0%,检测速度为57.9 FPS,在精度与实时性之间实现了良好平衡。该方法兼具高准确性与工程实用性,适用于复杂场景下的光伏组件高效缺陷检测任务。 展开更多
关键词 光伏组件 红外图像 缺陷检测 注意力机制 多尺度特征融合
在线阅读 下载PDF
基于CNN-BiLSTM-CBAM的多特征融合恶意PDF文档检测方法
14
作者 王友贺 孙奕 《信息网络安全》 北大核心 2025年第10期1579-1588,共10页
为应对现有恶意PDF文档检测方法忽视特征之间语义关系以及局限于单一类型的特征分析等问题,文章提出一种检测方案,将CNN-BiLSTM-CBAM的模型和多特征融合应用于恶意PDF文档检测中。该方法不仅融合了静态分析中提取的常规信息和结构信息,... 为应对现有恶意PDF文档检测方法忽视特征之间语义关系以及局限于单一类型的特征分析等问题,文章提出一种检测方案,将CNN-BiLSTM-CBAM的模型和多特征融合应用于恶意PDF文档检测中。该方法不仅融合了静态分析中提取的常规信息和结构信息,还结合了动态分析捕获的API序列信息,构建了一个全面多维的特征集。首先,该模型利用卷积神经网络提取特征集中的局部特征;然后,利用双向长短时记忆(BiLSTM)网络捕获特征间的依赖性和上下文语义关系特征,通过卷积块注意力模块(CBAM)为不同特征分配不同的权重,筛选出较具区分性的关键特征;最后,利用Softmax分类器计算检测结果。实验结果表明,与现有方法相比,该模型在准确率、召回率和F1分数等关键性能指标上均展现出显著优势,有效提升了恶意PDF文档的检测性能。 展开更多
关键词 恶意PDF文档检测 多特征融合 卷积块注意力模块 双向长短时记忆网络
在线阅读 下载PDF
基于改进RetinaNet模型速冻水饺表面缺陷检测 被引量:1
15
作者 费致根 郭兴 +2 位作者 宋晓晓 鲁豪 赵鑫昌 《食品工业科技》 北大核心 2025年第6期9-19,共11页
目的:提升速冻水饺表面缺陷检测的精度。方法:制作了包含五种冻饺形态(正常、露馅、半饺、破肚、粘连)的数据集,提出了用于速冻水饺表面缺陷检测与定位的网络模型GX-RetinaNet。该模型基于RetinaNet网络改进,主干特征提取网络采用ResNeX... 目的:提升速冻水饺表面缺陷检测的精度。方法:制作了包含五种冻饺形态(正常、露馅、半饺、破肚、粘连)的数据集,提出了用于速冻水饺表面缺陷检测与定位的网络模型GX-RetinaNet。该模型基于RetinaNet网络改进,主干特征提取网络采用ResNeXt-50模型,增强网络特征提取能力,引入卷积块注意力模块(Convolutional Block Attention Module,CBAM)与Swish激活函数有效抑制背景噪声,通过在特征金字塔模块(Feature Pyramid Networks,FPN)后增加PAN结构(Path Aggregation Network)组成双向特征融合模块,可以提升对目标多尺度特征信息的融合能力。结果:GX-RetinaNet网络对工业现场条件下速冻水饺表面缺陷的在线检测精度优于主流的几种目标检测网络,其平均精度均值(mAP)为94.8%,召回率(Recall)为77.0%,F1分数(F1-score)为84.9%。与RetinaNet网络相比,mAP、Recall和F1-score分别提高了2.6%、2.6%、2.4%。结论:GX-RetinaNet网络模型可以满足冻饺表面缺陷检测精度的要求,本研究为深度学习理论在速冻水饺表面缺陷检测方面的应用提供了一种可行的方法。 展开更多
关键词 速冻水饺表面缺陷检测 RetinaNet ResNeXt-50 卷积块注意力模块 双向特征融合模块
在线阅读 下载PDF
骨骼点特征提取下运动姿态异常识别
16
作者 赵国栋 李勇啸 沈梦英 《现代电子技术》 北大核心 2025年第21期88-92,共5页
为解决传统方法在姿态异常识别中存在的特征表达能力不足、对视角变化敏感等问题,文中提出一种骨骼点特征提取下运动姿态异常识别方法。利用人体姿态估计算法处理运动监控视频,提取多分支骨骼点特征后,将其作为基于自适应图卷积的运动... 为解决传统方法在姿态异常识别中存在的特征表达能力不足、对视角变化敏感等问题,文中提出一种骨骼点特征提取下运动姿态异常识别方法。利用人体姿态估计算法处理运动监控视频,提取多分支骨骼点特征后,将其作为基于自适应图卷积的运动姿态异常识别模型的输入;基于密集邻接的空间图卷积模块捕捉同一帧视频中关节点之间的空间结构关系;通过多尺度时间图卷积模块学习连续帧视频运动姿态的动态演变,将这两个模块的输出送入到注意力融合模块中;利用空间、时间、通道注意力机制强化特征表达,由全连接层输出运动姿态异常识别结果。实验结果表明:该方法可实现运动姿态异常识别,F_(1) score、APE、PSI、MVC指标值分别为91.53%、1.13、0.72、0.915,模型具有一定的泛化性和鲁棒性。 展开更多
关键词 骨骼点特征 人体姿态估计 空间图卷积 时间图卷积 关节点 注意力融合模块
在线阅读 下载PDF
利用改进的YOLOv5方法实施高速公路施工车辆检测及效果
17
作者 李峰 代忠 +3 位作者 回达鹏 邢彬 赵建东 高宇航 《科学技术与工程》 北大核心 2025年第27期11842-11850,共9页
针对高速公路施工场景中背景干扰复杂、车辆种类多样以及目标特征稀缺等问题,提出了一种改进的YOLOv5高速公路施工车辆检测算法。首先,引入空间感知通道注意力机制(spatial-aware channel attention,SCA),通过动态调整通道权重,增强与... 针对高速公路施工场景中背景干扰复杂、车辆种类多样以及目标特征稀缺等问题,提出了一种改进的YOLOv5高速公路施工车辆检测算法。首先,引入空间感知通道注意力机制(spatial-aware channel attention,SCA),通过动态调整通道权重,增强与施工车辆相关的特征表达能力,同时抑制背景干扰;其次,采用改进的加权跨层特征融合网络结构(weighted cross-layer feature fusion network,WCL-FFN)替代原有的路径聚合网络(path aggregation network,PAN),优化了特征融合过程,减少了计算冗余,并显著提高了多尺度目标检测性能;此外,结合幻影操作降低网络计算量与参数量,提高检测效率;最后,使用高效交并比损失函数(efficient intersecion over union,EIoU)替代传统交并比损失函数(intersecion over union,IoU),改善了边界框回归精度,进一步提升了检测精度和网络收敛速度。为验证算法的有效性,在施工车辆数据集上进行了实验,结果表明:本文提出的改进YOLOv5模型的均值平均精度(mean average precision,mAP)达到90.5%,与YOLOv5s相比,mAP提高了8.9%;与YOLOx相比,提高了6.2%;与YOLOv8相比,提高了3.5%。该方法在复杂场景中表现出更强的鲁棒性,提供了高速公路施工车辆检测的高效解决方案。 展开更多
关键词 目标检测 高速公路 YOLOv5 注意力机制 特征融合 Ghost模块
在线阅读 下载PDF
基于双重注意力融合的三维目标检测方法
18
作者 雷志勇 《湖南大学学报(自然科学版)》 北大核心 2025年第8期80-91,共12页
针对Voxel-RCNN算法在检测远处小目标以及受到遮挡的目标时检测精度不足的问题,提出了一种改进的方法,命名为CS-Voxel-RCNN.首先,通过引入随机顺序、随机丢弃和随机噪声三项数据增强方法,丰富了训练样本的多样性,从而增强了模型的鲁棒性... 针对Voxel-RCNN算法在检测远处小目标以及受到遮挡的目标时检测精度不足的问题,提出了一种改进的方法,命名为CS-Voxel-RCNN.首先,通过引入随机顺序、随机丢弃和随机噪声三项数据增强方法,丰富了训练样本的多样性,从而增强了模型的鲁棒性.其次,通过在2D骨干网络中集成CBAM模块,运用通道注意力机制和空间注意力机制,对多尺度特征进行更为细致的处理,优化了特征融合效果.最后,通过新增DIoU损失分支,对原损失函数进行改进,着重强调目标边界框之间的距离信息,从而提高了目标边界框回归任务的准确性.在KITTI数据集上与一些经典的3D目标检测算法进行对比实验.结果表明,新提出的算法对比原Voxel-RCNN算法,在骑车者类的简单和困难级别上分别提升了2.91个百分点和0.87个百分点,并通过消融实验验证了各改进模块的有效性,这一系列改进方法在提高三维目标检测在现实场景中的实用性和准确性方面取得了积极的成果. 展开更多
关键词 三维目标检测 激光雷达点云 数据增强 注意力机制 特征融合
在线阅读 下载PDF
基于判别式增强的蒸馏学习自监督缺陷检测
19
作者 冯志远 陈莹 《系统仿真学报》 北大核心 2025年第6期1499-1511,共13页
针对异常缺陷数据稀缺、类型未知,以及传统知识蒸馏缺陷检测方法缺乏对异常表示多样性的问题,提出一种基于判别式增强的自监督蒸馏学习方法。提出一种基于注意力的多尺度融合模块,通过放大学生网络和教师网络多尺度的特征差异来提高对... 针对异常缺陷数据稀缺、类型未知,以及传统知识蒸馏缺陷检测方法缺乏对异常表示多样性的问题,提出一种基于判别式增强的自监督蒸馏学习方法。提出一种基于注意力的多尺度融合模块,通过放大学生网络和教师网络多尺度的特征差异来提高对异常表示的能力;设计一种由特征重加权模块和解码器组成的判别网络,通过进一步强调教师网络中的异常特征来生成更加精准的异常分数图,从而提高缺陷检测分割精度。结果表明:该方法超过了现有的知识蒸馏缺陷检测方法,验证了方法的有效性与优越性。 展开更多
关键词 缺陷检测 知识蒸馏 基于注意力的多尺度融合模块 特征重加权模块 判别网络
在线阅读 下载PDF
绿色数字技术赋能电网基建质量检测的实现方法
20
作者 陈然 柯方超 +4 位作者 赵爽 贺兰菲 许琪林 许小薇 张佳恒 《高压电器》 北大核心 2025年第5期111-120,共10页
高质量发展背景下,包含人工智能技术在内的绿色数字技术对于促进电网基建质量检测发展起着重要作用。当前电网基建过程中已能够实现质量检测安全化和智能化。然而,其中难免存在误检、漏检、检测效率不高等问题。为此,文中提出了一种基于... 高质量发展背景下,包含人工智能技术在内的绿色数字技术对于促进电网基建质量检测发展起着重要作用。当前电网基建过程中已能够实现质量检测安全化和智能化。然而,其中难免存在误检、漏检、检测效率不高等问题。为此,文中提出了一种基于CBAM-ASFF-YOLOv4的电网基建质量智能检测方法。首先,该方法在YOLOv4算法的颈部网络结构中引入自适应空间特征融合(adaptively spatial feature fusion,ASFF)改进原有PANet,通过优化特征融合来解决目标尺度多变的问题。其次,通过在各个特征层后添加卷积块注意力模块(convolutional block attention module,CBAM)有效增强了主干网络对电网基建质量检测小目标的特征提取能力。最后,采用动态权值确定方法以减少准确检测结果的损失占比。算例仿真结果表明,文中所提质量智能检测方法的检测平均精度和检测速度分别达到92.81%和41.16 fps,相比SSD、Faster-RCNN以及YOLOv4缩短了检测时间,提高了算法的收敛速度和检测精度,能够在实现隐患图像缺陷自动识别的同时输出相应的告警数据与报告。 展开更多
关键词 电网基建 智能检测 特征融合 卷积块注意力模块 YOLOv4
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部