期刊文献+
共找到156篇文章
< 1 2 8 >
每页显示 20 50 100
BDMFuse:Multi-scale network fusion for infrared and visible images based on base and detail features
1
作者 SI Hai-Ping ZHAO Wen-Rui +4 位作者 LI Ting-Ting LI Fei-Tao Fernando Bacao SUN Chang-Xia LI Yan-Ling 《红外与毫米波学报》 北大核心 2025年第2期289-298,共10页
The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method f... The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method for infrared and visible image fusion is proposed.The encoder designed according to the optimization objective consists of a base encoder and a detail encoder,which is used to extract low-frequency and high-frequency information from the image.This extraction may lead to some information not being captured,so a compensation encoder is proposed to supplement the missing information.Multi-scale decomposition is also employed to extract image features more comprehensively.The decoder combines low-frequency,high-frequency and supplementary information to obtain multi-scale features.Subsequently,the attention strategy and fusion module are introduced to perform multi-scale fusion for image reconstruction.Experimental results on three datasets show that the fused images generated by this network effectively retain salient targets while being more consistent with human visual perception. 展开更多
关键词 infrared image visible image image fusion encoder-decoder multi-scale features
在线阅读 下载PDF
Ship recognition based on HRRP via multi-scale sparse preserving method
2
作者 YANG Xueling ZHANG Gong SONG Hu 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第3期599-608,共10页
In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) ba... In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) based on the maximum margin criterion(MMC) is proposed for recognizing the class of ship targets utilizing the high-resolution range profile(HRRP). Multi-scale fusion is introduced to capture the local and detailed information in small-scale features, and the global and contour information in large-scale features, offering help to extract the edge information from sea clutter and further improving the target recognition accuracy. The proposed method can maximally preserve the multi-scale fusion sparse of data and maximize the class separability in the reduced dimensionality by reproducing kernel Hilbert space. Experimental results on the measured radar data show that the proposed method can effectively extract the features of ship target from sea clutter, further reduce the feature dimensionality, and improve target recognition performance. 展开更多
关键词 ship target recognition high-resolution range profile(HRRP) multi-scale fusion kernel sparse preserving projection(MSFKSPP) feature extraction dimensionality reduction
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
3
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
基于改进Swin Transformer的人脸活体检测 被引量:1
4
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 Swin Transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
基于多尺度特征融合SSDLite的光伏组件缺陷检测 被引量:1
5
作者 项新建 汤卉 +3 位作者 肖家乐 王世乾 张颖超 王磊 《太阳能学报》 北大核心 2025年第1期669-675,共7页
为了应对光伏组件缺陷检测中人工检测速度缓慢以及使用YOLO等深度学习模型时速度较慢且硬件成本高的问题,提出一种基于SSDLite的多层特征融合轻量化目标检测方法。该方法采用MobileNetV2作为SSDLite模型的骨干网络,并从中提取3个不同层... 为了应对光伏组件缺陷检测中人工检测速度缓慢以及使用YOLO等深度学习模型时速度较慢且硬件成本高的问题,提出一种基于SSDLite的多层特征融合轻量化目标检测方法。该方法采用MobileNetV2作为SSDLite模型的骨干网络,并从中提取3个不同层次的特征层进行特征融合。针对不同缺陷的尺寸特点,对模型中的先验框的大小也进行了重新设计。在MobileNetV2的瓶颈结构中引入CBAM注意力机制,以提高模型的检测精度。相比传统的SSDLite模型,该文模型平均精度从65.8%提高至72.4%,虽然速度略微下降,但已基本满足实际应用的需求。 展开更多
关键词 光伏组件 目标检测 深度学习 SSDLite 多层特征融合 MobileNetV2
在线阅读 下载PDF
CSD-YOLOv8的输电线路故障目标检测
6
作者 马旭 王锐 +6 位作者 邓军 常驰 郝帅 李添麒 刘峥岐 李国亮 赵晴 《西安科技大学学报》 北大核心 2025年第2期383-392,共10页
针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入... 针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入空间金字塔池化将不同尺度特征进行融合;然后,在检测网络头部中引入深度可分离卷积,并将其与交叉卷积连接模块结合,实现对部分遮挡目标的准确检测;此外,设计基于通道注意力机制的特征融合模块对不同层级特征进行加权融合,提高复杂背景下故障目标特征信息提取能力;最后,利用某电力巡检部门近5年的巡检数据对所提出算法进行验证。结果表明:相比于4种经典对比算法,所提方法在对12种故障类型检测效果的综合指标最好,平均检测精度为94.7%,召回率为93.0%。与此同时,所提算法具有较好的实时性,对于分辨率为1280×720的图像检测速度为45帧/s,为输电线路的智能巡检奠定了坚实的理论基础。 展开更多
关键词 YOLOv8 多尺度检测 通道注意力机制 特征融合 深度可分离模块
在线阅读 下载PDF
基于孪生网络的特征融合位移RGB-T目标跟踪
7
作者 李海燕 曹永辉 +1 位作者 郎恂 李海江 《湖南大学学报(自然科学版)》 北大核心 2025年第4期68-78,共11页
为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多... 为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多模态目标跟踪框架,设计了改进步长的ResNet50作为特征提取网络,有效挖掘目标的深层次特征.随后,设计特征交互学习模块,利用一种模态的判别信息引导另一种模态的目标外观特征学习,挖掘特征空间和通道中的跨模态信息,增强网络对前景信息的关注.然后,设计多模特征融合模块计算输入的可见光图像和红外图像的特征融合度,对不同模态的重要特征进行空间融合以去除冗余信息,并采用级联融合策略重建多模态图像,增强目标特征表示.最后,设计特征空间位移模块,分割红外模态分支的特征图并向四个不同方向移位,增强热源目标特征的边缘表示.在两个RGB-T数据集上的实验验证了提出算法的有效性,消融实验证明了设计的单个模块的优越性. 展开更多
关键词 RGB-T跟踪 多模特征融合模块 特征空间位移模块 特征交互学习模块
在线阅读 下载PDF
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
8
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
基于Transformer两阶段策略的古代服饰线图提取
9
作者 周蓬勃 冯龙 +1 位作者 武浩东 寇宇帆 《西北大学学报(自然科学版)》 北大核心 2025年第1期75-84,共10页
古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第... 古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第一阶段将图像分割成16×16粗粒度补丁,利用编码器进行全局自注意力计算以捕获补丁间依赖;第二阶段采用8×8细粒度无重叠滑动窗口覆盖图像,通过局部编码器计算窗口内注意力有效捕捉细微边缘且降低成本。设计了轻量特征融合模块,支持全局与局部特征的高效整合。实验结果表明,该方法在古代服饰和公共数据集上边缘轮廓信息提取效果优于现有方法,ODS指标平均提升15.9%。虽然OIS和AP未超过Informative Drawing,但在模型体量和耗时方面具有明显优势。 展开更多
关键词 边缘检测 TRANSFORMER 轻量特征融合模块
在线阅读 下载PDF
多尺度融合增强与注意力机制结合的图像语义分割
10
作者 刘书刚 杜昊东 王洪涛 《计算机应用与软件》 北大核心 2025年第6期225-233,278,共10页
针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特... 针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特征信息进行融合,在解码器末端使用改进的轻量化卷积注意力模块,使得对于物体边界分割更加充分。通过在Pascal VOC2007和Cityscapes数据集上进行实验验证,结果表明该方法较原有网络的精确度有显著的提高。 展开更多
关键词 语义分割 特征融合增强 注意力模块 编码器 上采样
在线阅读 下载PDF
基于改进TransUNet的肺部图像分割
11
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
基于深度学习的车道线检测算法
12
作者 岳永恒 赵志浩 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期22-30,共9页
针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现... 针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现图像的多尺度特征提取;接着,网络框架中设计多尺度空间注意力模块,且引入SimAM轻量级注意力机制,以增强对目标特征的聚焦能力;然后,设计自适应特征融合模块,通过智能调整不同尺度特征图的融合权重,对PANet输出的特征图进行跨尺度融合,以提升网络对复杂特征的提取能力。在TuSimple数据集上的实验结果表明,所提算法的检测精度为96.84%,较原算法提升了1.02个百分点,优于传统的主流算法;在CULane数据集上的实验结果表明,所提算法的F_(1)值为72.74%,优于传统的主流算法,较原算法提升了4.34个百分点,尤其在强光和阴影等极端场景下的检测性能提升显著,说明所提算法在复杂场景下具有优异的检测能力;实时性测试结果显示,所提算法的推理速度达118.0 f/s,满足智能车辆的实时性需求。 展开更多
关键词 车道线检测 深度学习 多尺度空间注意力机制 自适应特征融合
在线阅读 下载PDF
基于特征分治与融合的铁路扣件轻量化实时检测模型
13
作者 鄢化彪 林初欣 +3 位作者 黄绿娥 李东丽 刘词波 徐方奇 《北京交通大学学报》 北大核心 2025年第3期56-67,共12页
为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景... 为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景对目标的干扰;其次,提出一种二重分治特征融合方法,提升对不同大小目标的检测能力,同时在检测头(YOLO Head)的代价体构建方面,引入可变焦距损失函数(Varifocal Loss,VFL)代替YOLOX-Nano检测头的二值交叉熵损失函数,提高轻量化实时检测的精度;再次,使用随机Alpha-IoU(RAL)损失函数动态调整参数,延缓算法的收敛速度从而优化模型的训练曲线,避免模型训练过程陷入局部最优解;最后,采集10233个检测目标并划分为6种类型,选择YOLOX-Nano、Faster R-CNN及YOLOv8n等主流目标检测模型作为对比进行实验.实验结果表明:所提模型的每秒帧数(Frames Per Second,FPS)为60.24,平均精度(Average Precision,AP)为83.40%,较基线模型提高了3.24%;参数量为2.31 M,较YOLOX-Tiny减少54.08%,浮点数计算量为1.99 G,较YOLOX-Tiny减少69.15%.研究成果可为轻量级实时检测模型与计算系统提供参考. 展开更多
关键词 轻量级嵌入式系统 分治混合注意力模块 分治特征融合 代价体构建
在线阅读 下载PDF
基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别
14
作者 毛清华 苏毅楠 +3 位作者 贺高峰 翟姣 王荣泉 尚新芒 《工矿自动化》 北大核心 2025年第1期11-20,103,共11页
针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换... 针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换主干网络C2f模块为C2fER模块,加强模型的细节特征提取能力,提升模型对小目标人员的识别性能;通过在颈部网络引入特征强化加权双向特征金字塔网络(FE-BiFPN)结构,提高模型的特征融合能力,从而提升模型对多尺度人员目标的识别效果;通过引入分离增强注意力模块(SEAM)增强模型在复杂背景下对局部特征的关注度,提升模型对遮挡目标人员的识别能力;通过引入WIoU损失函数增强训练效果,提升模型识别准确率。消融实验结果表明:改进YOLOv8模型的准确率较基线模型YOLOv8s提升2.3%,mAP@0.5提升3.4%,识别速度为104帧/s。人员识别实验结果表明:与YOLOv10m,YOLOv8s-CA、YOLOv8s-SPDConv和YOLO8n模型相比,改进YOLOv8模型对小目标、多尺度目标、遮挡目标的识别效果均更佳,识别准确率为90.2%,mAP@0.5为87.2%。人员入侵危险区域实验结果表明:井下人员入侵带式输送机危险区域智能识别系统判别人员入侵危险区域的平均准确率为93.25%,满足识别需求。 展开更多
关键词 煤矿带式输送机 人员入侵危险区域 YOLOv8模型 遮挡目标检测 小目标检测 多尺度融合 C2fER模块 特征强化加权双向特征金字塔网络结构
在线阅读 下载PDF
基于多尺度时空特征融合的视频异常事件检测 被引量:1
15
作者 李歌 肖洪兵 +2 位作者 闫善武 王瑜 孙梅 《燕山大学学报》 北大核心 2025年第1期74-82,共9页
在视频异常事件检测的问题上,现有的研究方法未充分考虑场景中的背景信息干扰和目标尺度变化,导致检测精度普遍较低。针对此类问题,提出了一种融合多尺度时空信息的异常事件检测方法。首先,应用一种坐标注意力的方法,使模型更多地关注... 在视频异常事件检测的问题上,现有的研究方法未充分考虑场景中的背景信息干扰和目标尺度变化,导致检测精度普遍较低。针对此类问题,提出了一种融合多尺度时空信息的异常事件检测方法。首先,应用一种坐标注意力的方法,使模型更多地关注异常事件发生的区域。其次,为了提取到各层次丰富的时空信息,采用空洞卷积网络构建一种多分支多尺度的特征融合模块。最后,考虑到正常事件的多样性,提出一种规则分数,以便在测试阶段进一步更新记忆增强模块中的记忆项,提高对异常事件的检测精度。在CUHK Avenue和ShanghaiTech数据集的相关实验中,提出方法的帧级AUC分别达到了88.7%和77.5%,且满足视频检测的实时性要求,验证了该方法的可行性和有效性。 展开更多
关键词 视频异常检测 无监督学习 空洞卷积 多尺度时空特征融合 记忆增强模块
在线阅读 下载PDF
改进YOLOv7-Tiny的道路裂缝检测算法 被引量:3
16
作者 王启涵 刘超 《计算机工程与应用》 北大核心 2025年第10期372-380,共9页
道路裂缝检测是道路工程中的重要环节。针对现阶段道路裂缝检测算法中准确度低、效率低的问题,提出了一种基于YOLOv7-Tiny的轻量型道路裂缝检测算法YOLOv7-TPSF。引入部分卷积PConv,对原网络中耗参量较多的3×3卷积层进行部分替换,... 道路裂缝检测是道路工程中的重要环节。针对现阶段道路裂缝检测算法中准确度低、效率低的问题,提出了一种基于YOLOv7-Tiny的轻量型道路裂缝检测算法YOLOv7-TPSF。引入部分卷积PConv,对原网络中耗参量较多的3×3卷积层进行部分替换,降低模型的参数量,提升模型的训练速度;结合特征融合网络BiFusion Neck与加权特征金字塔BiFPN的优点,提出了新的特征融合模块Bi-FusFPN,减少网络计算量,强化多尺度特征的融合能力;在输出端添加无参注意力机制SimAM,进一步提高大、中、小三类目标的检测能力。实验结果表明,YOLOv7-TPSF算法相较于YOLOv7-Tiny算法,网络参数量与计算量分别减少了31.7%、34.6%,准确度与检测速度分别提高了3.7%、9.7%,一定程度上满足了道路裂缝检测准确性与实时性的需求。 展开更多
关键词 道路裂缝检测 YOLOv7-Tiny 轻量型 注意力机制 特征融合模块Bi-FusFPN
在线阅读 下载PDF
基于Ghost卷积与自适应注意力的点云分类 被引量:1
17
作者 舒密 王占刚 《现代电子技术》 北大核心 2025年第6期106-112,共7页
点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,... 点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,提出一种基于点云Transformer的轻量级特征增强融合分类网络EFF-LPCT。EFF-LPCT使用一维化Ghost卷积对原始网络进行重构,以降低计算复杂度和内存要求;引入自适应支路权重,以实现注意力层级间的多尺度特征融合;利用多个通道注意力模块增强特征的通道交互信息,以提高模型分类效果。在ModelNet40数据集进行的实验结果表明,EFF-LPCT在达到93.3%高精度的同时,相较于点云Transformer减少了1.11 GFLOPs的浮点计算量和0.86×10^(6)的参数量。 展开更多
关键词 点云分类 Transformer网络 Ghost卷积 特征增强融合模块 ECA通道注意力 特征学习
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
18
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
驾驶素质缺失测试眼状态的深度学习分类方法研究
19
作者 杨旺达 万亚平 +3 位作者 邹刚 闵晓珊 王沂 陆宇程 《计算机工程》 北大核心 2025年第2期149-158,共10页
由驾驶员的不安全行为导致的交通事故占多数,针对驾驶认知素质特性的研究,搭建虚拟驾驶场景评估驾驶者的驾驶素质,可以最大限度地贴近现实环境和操作,唤醒驾驶者的潜在驾驶能力和应对能力。眼球运动可以极大程度地反映出驾驶者的认知状... 由驾驶员的不安全行为导致的交通事故占多数,针对驾驶认知素质特性的研究,搭建虚拟驾驶场景评估驾驶者的驾驶素质,可以最大限度地贴近现实环境和操作,唤醒驾驶者的潜在驾驶能力和应对能力。眼球运动可以极大程度地反映出驾驶者的认知状态,但目前多数眼动状态识别研究主要关注在自然状态中基本视觉运动方向或者眼睑的闭合,识别类别的能力和效果对于驾驶场景的认知状态评估有限。收集了10类静态眼动方向的双眼数据,并提出融合注意力机制的多尺度眼状态图像识别模型。首先,使用部分卷积设计双分支特征融合模块,在加强模型特征提取能力的同时减少计算冗余;然后,在双分支特征融合的残差模块中嵌入改进的坐标注意力(CA)机制,提升模型对不同尺度特征的信息表征能力;最后,对模型的通道结构和数量进行调整,平衡模型的参数量与识别准确率。实验结果表明,所提方法在构建的10类眼动状态数据集上识别准确率达到95.1%,相比改进前的网络提高3.4个百分点;在Eye Chimera数据集和MRL眼睛数据集上的识别准确率分别为95.1%和98.95%,可以满足在虚拟驾驶测试环境下眼动状态识别的要求,并为进一步结合多参数分析驾驶素质缺失任务奠定基础。 展开更多
关键词 驾驶认知 眼状态 图像分类 特征融合 注意力模块
在线阅读 下载PDF
基于ASPP模块及特征图加权融合的图像语义分割算法
20
作者 祁新 杜洪波 朱立军 《计算机应用与软件》 北大核心 2025年第3期227-232,267,共7页
针对现有语义分割算法对特征图进行高级语义信息提取时存在部分低、中层级细节信息丢失的问题,提出基于ASPP模块及特征图加权融合的图像语义分割算法。改进算法借助“残差思想”,建立特征提取网络与ASPP模块之间的跳跃连接,融合特征图加... 针对现有语义分割算法对特征图进行高级语义信息提取时存在部分低、中层级细节信息丢失的问题,提出基于ASPP模块及特征图加权融合的图像语义分割算法。改进算法借助“残差思想”,建立特征提取网络与ASPP模块之间的跳跃连接,融合特征图加权,增加ASPP模块提取图像语义信息的能力,减少低、中层部分细节信息丢失,并在相应卷积层后进行批归一化,缓解梯度消失的问题,提高模型的分割性能和运行效率。实验结果表明,特征图的合理融合使得语义分割图边缘细节更好地保留,改进算法分割精度提高,其平均交并比比原模型提高6.8%,频率加权交并比提高5.33%。 展开更多
关键词 语义分割 ASPP模块 特征图加权 平均交并比 频率加权交并比
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部