期刊文献+
共找到334篇文章
< 1 2 17 >
每页显示 20 50 100
基于自适应多尺度注意力机制的CNN-GRU矿用电动机健康状态评估 被引量:1
1
作者 谭东贵 袁逸萍 樊盼盼 《工矿自动化》 CSCD 北大核心 2024年第2期138-146,共9页
利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题... 利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题。针对上述问题,提出了一种基于自适应多尺度注意力机制的CNN-GRU(CNN-GRU-AMSA)模型,用于评估矿用电动机健康状态。首先,对传感器采集的电动机运行数据进行填补、剔除和标准化处理,并以环境温度变化作为依据对矿用电动机运行数据进行工况划分。然后,根据马氏距离计算出电动机电流、电动机三相绕组温度、电动机前端轴承温度和电动机后端轴承温度等健康评估指标的健康指数(HI),采用Savitzky–Golay滤波器对指标HI进行降噪、平滑、归一化处理,并结合主成分分析法计算的不同指标对矿用电动机的贡献度,对指标HI进行加权融合得到矿用电动机HI。最后,将矿用电动机HI输入CNN-GRU-AMSA模型中,该模型通过动态调整注意力权重,实现对不同尺度特征的信息融合,从而准确输出电动机健康状态评估结果。实验结果表明,与其他常见的深度学习模型CNN,CNN-GRU,CNN-LSTM,CNN-LSTM-Attention相比,CNN-GRU-AMSA模型在均方根误差、平均绝对误差、准确率、Macro F1及Micro F1等评价指标上更优,且预测残差的波动范围更小,稳定性更优。 展开更多
关键词 电动机健康状态评估 自适应多尺度注意力机制 CNN-GRU 多传感器信息融合 主成分分析
在线阅读 下载PDF
MDA-MIM:一种融合多尺度特征与双重注意力机制的雷达回波图预测模型
2
作者 胡强 高雅婷 +1 位作者 尹宾礼 渠连恩 《通信学报》 北大核心 2025年第3期248-257,共10页
为提升雷达回波图中时空特征的提取质量,提出了一种基于多尺度特征融合和双重注意力机制的MIM改进(MDA-MIM)模型。该模型基于空洞卷积实现多尺度特征提取与融合。通过在MIM模型中的非平稳模块集成自注意力机制,调整不同时间步长和空间... 为提升雷达回波图中时空特征的提取质量,提出了一种基于多尺度特征融合和双重注意力机制的MIM改进(MDA-MIM)模型。该模型基于空洞卷积实现多尺度特征提取与融合。通过在MIM模型中的非平稳模块集成自注意力机制,调整不同时间步长和空间位置的权重,更精确地捕捉雷达回波数据中的非平稳性特征。在平稳模块引入局部注意力机制,以聚焦于局部区域内的特征关联,增强对平稳性特征的捕捉能力。真实数据集上的实验结果表明,MDA-MIM具有优秀的预测性能,在MSE、MAE、SSIM和PSNR等指标上均优于对比模型。 展开更多
关键词 雷达回波图 时空预测 注意力机制 多尺度特征
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的视频异常检测方法
3
作者 吴祥 肖剑 吉根林 《应用科学学报》 北大核心 2025年第2期234-244,共11页
视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限... 视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限制了其异常检测的性能。针对该问题,本文基于生成对抗网络结构,提出了一种基于多尺度特征融合和注意力机制的视频异常检测方法。使用大小不同的卷积核捕获不同感受野的特征,并将它们进行融合以获得多尺度的特征表示。此外,在生成器的转置卷积层后引入坐标注意力机制,自适应分配特征图权重,从而增强模型对关键特征的感知能力。在公开数据集UCSD Ped2和Avenue上的实验结果表明,本文方法的性能优于其他同类方法。 展开更多
关键词 视频异常检测 深度学习 生成对抗网络 多尺度特征融合 注意力机制
在线阅读 下载PDF
基于多尺度注意力机制的无人机小目标检测算法
4
作者 冯迎宾 郭枭尊 晏佳华 《兵工学报》 北大核心 2025年第1期12-21,共10页
针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster ... 针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster Block_C2f,EF_C2f),替换YOLOv8网络中的C2f模块,提高网络对小目标特征的提取能力;在特征融合网络中增加P1检测层,并设计一种跨尺度特征融合结构(Bi-Path Aggregation Network,BPAN),融合小目标特征信息;增加一个微小目标检测头,使用SIoU Loss作为边界框损失函数,提升小目标检测精度和网络收敛速度。在公开数据集VisDrone2019上进行实验验证。验证结果表明:与YOLOv8s算法相比,新算法在检测精度上提升了6.9%、mAP50提升了9.1%,模型参数量减少了44.6%,检测速度为28帧/s,新算法在小目标检测领域具有一定的实用性。 展开更多
关键词 多尺度注意力机制 YOLOv8s算法 特征提取 尺度特征融合 小目标检测
在线阅读 下载PDF
基于多尺度CNN与双阶段注意力机制的轴承工况域泛化故障诊断
5
作者 乔卉卉 赵二贤 +3 位作者 郝如江 刘婕 刘帅 王勇超 《振动与冲击》 北大核心 2025年第2期267-278,共12页
变工况条件下,基于深度学习的列车轮对轴承故障诊断模型的训练集与测试集通常来自不同的工况,不同工况振动信号数据分布差异引起的领域漂移问题导致模型准确率降低。基于域适应的变工况轴承故障诊断方法需要获取目标工况域的样本数据参... 变工况条件下,基于深度学习的列车轮对轴承故障诊断模型的训练集与测试集通常来自不同的工况,不同工况振动信号数据分布差异引起的领域漂移问题导致模型准确率降低。基于域适应的变工况轴承故障诊断方法需要获取目标工况域的样本数据参与训练,这在工程实际中难以实现,因此无法实现未知工况的轴承故障诊断。针对以上问题,提出了一种基于多尺度卷积神经网络与双阶段注意力机制网络(two-stage attention multiscale convolutional network model, TSAMCNN)模型的轴承工况域泛化故障诊断方法,其中多尺度特征提取模块从多个尺度上提取时域振动信号中更丰富的故障信息;然后,双阶段注意力模块从通道和空间两个维度自适应地增强故障敏感特征并抑制工况敏感特征和无用特征;最终,提取工况域不变故障特征,从而实现工况域泛化轴承故障诊断。通过变转速和变负载列车轮对轴承故障诊断试验,证明了TSAMCNN模型可提高变工况条件下轴承故障诊断的准确率、抗噪性能和工况域泛化能力。此外,对双阶段注意力机制的权重向量和模型各模块提取的特征进行可视化分析,提高了模型可解释性。 展开更多
关键词 列车轮对轴承 工况域泛化故障诊断 卷积神经网络(CNN) 多尺度特征提取 注意力机制
在线阅读 下载PDF
基于多尺度注意力机制的红外与可见光图像融合研究
6
作者 杨涛 刘福华 《无线互联科技》 2025年第5期46-52,共7页
红外与可见光图像的融合旨在提取和整合源图像中的信息,以生成包含重要且互补信息的结果。然而,目前的融合规则在有效提取最有价值的信息方面存在不足,无法很好地保留关键信息。文章在DenseFuse网络中引入了多头注意力模块(Multi-scale ... 红外与可见光图像的融合旨在提取和整合源图像中的信息,以生成包含重要且互补信息的结果。然而,目前的融合规则在有效提取最有价值的信息方面存在不足,无法很好地保留关键信息。文章在DenseFuse网络中引入了多头注意力模块(Multi-scale Attention Block,MAB)。该模块通过多尺度大核注意力机制,更有效地捕捉全局与局部信息。这使得融合后的图像具有更加丰富的语义信息,从而提升其在后续高层次视觉任务中的表现。 展开更多
关键词 图像融合 多尺度注意力机制 多头注意力模块
在线阅读 下载PDF
基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割算法
7
作者 党宁 李世峰 于坤義 《电子技术应用》 2025年第4期66-71,共6页
无人机在光伏系统的巡检过程中需要对光伏组件的缺陷进行准确和快速识别,为此提出了一种基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割网络。首先在传统的U-Net网络每个Stage加入多尺度伸缩卷积模块,从而对光伏组件缺陷进行分割,P... 无人机在光伏系统的巡检过程中需要对光伏组件的缺陷进行准确和快速识别,为此提出了一种基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割网络。首先在传统的U-Net网络每个Stage加入多尺度伸缩卷积模块,从而对光伏组件缺陷进行分割,PA达到了98.61%,与传统U-Net、FCN网络进行对比分析,准确率分别提高了0.32%和1.17%,算法消耗时间0.054 s,相较于对比的分割算法提高了0.006 s~0.013 s;然后将分割后的缺陷掩码mask和原图进行与操作,最后通过轻量级网络MobileNetV3对光伏组件缺陷(热斑、裂缝、鸟粪)进行检测并分类,精确率达到了98.82%,与SqueezeNet、ShuffleNet V2和GhostNet网络进行对比,分别提高了0.43%、1.08%和0.8%,平均检测时间0.026s,相较于对比的检测算法提高了0.002s~0.036s。实验结果表明基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割网络具有较高的准确率和识别速率。 展开更多
关键词 光伏组件缺陷 注意力机制 多尺度伸缩卷积 U-net网络 MobileNetV3网络
在线阅读 下载PDF
应用自适应注意力机制U-net的地震数据高分辨处理 被引量:2
8
作者 赵明 赵岩 +2 位作者 沈东皞 王建强 代显才 《石油地球物理勘探》 EI CSCD 北大核心 2024年第4期675-683,共9页
随着油气勘探开发的不断深入,薄储层与岩性油气藏逐渐成为重要的勘探目标,这也对地震资料的分辨率提出了更高的要求。文中提出了一种基于自适应注意力机制的U-net地震数据高分辨处理方法。该方法首先利用U-net结构学习地震数据的特征表... 随着油气勘探开发的不断深入,薄储层与岩性油气藏逐渐成为重要的勘探目标,这也对地震资料的分辨率提出了更高的要求。文中提出了一种基于自适应注意力机制的U-net地震数据高分辨处理方法。该方法首先利用U-net结构学习地震数据的特征表示,通过下采样过程的编码器提取地震数据的抽象特征,然后通过上采样的解码器进行特征重建和细化。在上采样的过程中引入了注意力机制,用于自适应地调整网络对不同地震特征的关注程度,网络能够更加有效地捕捉到地震数据更多的细节和特征。Marmousi模型合成地震记录和实际数据实验结果表明,新网络比原U-net误差更小、更稳定,可有效提高预测精度,实现对地震数据的高分辨率处理。 展开更多
关键词 地震数据处理 高分辨率 U-net 注意力机制 自适应
在线阅读 下载PDF
基于融合注意力机制LSTM网络的地下水位自适应鲁棒预测 被引量:3
9
作者 佃松宜 厉潇滢 +2 位作者 杨丹 芮胜阳 郭斌 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第1期54-64,共11页
地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问... 地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问题,本文提出了一种新的鲁棒自适应水位预测算法。首先,对水文数据进行预处理,解决了数据时间跨度大、噪声多、缺失及异常、非平稳等问题。其次,针对不同输入特征对预测指标的影响,在模型训练阶段提出一种新的空间变量注意机制,可快速识别与水位关联的关键变量,并对输入特征赋予不同的影响权重。然后,针对不同序列长度对预测效果的影响,还设计了自适应时间注意力机制,帮助网络自适应地找出与不同时间序列长度预测指标相关的编码器隐藏状态,以更好地捕捉时间上的依赖关系。在此基础上,以上下文向量作为输入,提出一种融合注意力机制的长短时记忆网络水文预测算法。最后,通过意大利Petrignano水文数据验证了所提算法的有效性,并与GRU、Elman、LSTM、VA–LSTM和S–LSTM等方法进行预测性能比较。结果表明,基于融合注意力机制的LSTM网络在面临大规模、噪点多的复杂数据时有优于其它几种算法的预测效果,表明该算法具有强自适应性和鲁棒性。本文研究结果可以为市政排水策略合理调整、及时控制提供参考。 展开更多
关键词 地下水位预测 时间与空间注意力机制 LSTM网络 自适应预测 鲁棒预测
在线阅读 下载PDF
基于自适应特征融合和注意力机制的变电设备红外图像识别 被引量:1
10
作者 王媛彬 吴冰超 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3749-3756,共8页
针对变电设备红外图像复杂背景下多目标、小目标及遮挡目标识别效果差的问题,该文提出一种基于中心点网络(CenterNet)的变电设备红外图像识别方法。通过将自适应特征融合模块(ASFF)和特征金字塔(FPN)相结合,构建ASFF+FPN结构的特征融合... 针对变电设备红外图像复杂背景下多目标、小目标及遮挡目标识别效果差的问题,该文提出一种基于中心点网络(CenterNet)的变电设备红外图像识别方法。通过将自适应特征融合模块(ASFF)和特征金字塔(FPN)相结合,构建ASFF+FPN结构的特征融合网络,增强了模型对多目标和小目标的跨尺度特征融合能力,排除背景信息;针对网络对遮挡目标特征捕捉能力差的问题,在特征融合网络中添加全局注意力机制,增强目标显著度;为实现模型轻量化,引入深度可分离卷积,减少参数量和推理时间;最后,通过引入分布焦点损失函数,克服了原损失函数对遮挡目标敏感性差的问题,提升了模型收敛速度和识别精度。在包含7种红外变电设备图像的自建数据集上进行测试。实验表明该算法与原始算法相比,识别精度提升了3.55%,达到了95.19%,模型参数量仅为32.52M,与4种主流目标识别算法对比,该算法在识别精度和算法复杂度上具有明显优势。 展开更多
关键词 变电设备 红外图像识别 中心点网络 自适应特征融合 注意力机制
在线阅读 下载PDF
融合多尺度特征和注意力机制的超声甲状腺结节分割
11
作者 赵欣 黎红豆 王洪凯 《声学技术》 CSCD 北大核心 2024年第5期668-676,共9页
针对目前超声影像下甲状腺结节分割不够精准的问题,提出一种融合多尺度特征和注意力机制的超声甲状腺结节分割方法。该模型编码设计了多感受野通道选择模块,通过核心选择注意力对多个不同感受野的特征进行自适应加权组合,使包含目标的... 针对目前超声影像下甲状腺结节分割不够精准的问题,提出一种融合多尺度特征和注意力机制的超声甲状腺结节分割方法。该模型编码设计了多感受野通道选择模块,通过核心选择注意力对多个不同感受野的特征进行自适应加权组合,使包含目标的感受野通道占据主导。同时,设计自适应全局上下文模块自适应地提取瓶颈层多个尺度的全局上下文特征,以实现对瓶颈层高级语义的有效编码。此外,设计双注意力引导模块增强编解码器对等层之间的特征融合,以减少上采样过程中的信息损失。在公开的超声甲状腺结节数据集上进行实验,结果表明,文中所提方法优于其他对比网络,能更加精准地分割出甲状腺结节,有效提升了甲状腺结节的分割性能。 展开更多
关键词 深度学习 甲状腺结节 超声图像分割 多尺度特征提取 注意力机制
在线阅读 下载PDF
基于多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合
12
作者 邸敬 梁婵 +2 位作者 任莉 郭文庆 廉敬 《红外技术》 CSCD 北大核心 2024年第7期754-764,共11页
针对目前红外与可见光图像融合存在特征提取不足、融合图像目标区域不显著、细节信息缺失等问题,提出了一种多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合方法。首先,设计了多尺度对比度增强模块,以增强目标区域强度... 针对目前红外与可见光图像融合存在特征提取不足、融合图像目标区域不显著、细节信息缺失等问题,提出了一种多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合方法。首先,设计了多尺度对比度增强模块,以增强目标区域强度信息利于互补信息的融合;其次,采用密集连接块进行特征提取,减少信息损失最大限度利用信息;接着,设计了一种跨维度交互注意力机制,有助于捕捉关键信息,从而提升网络性能;最后,设计了从融合图像到源图像的分解网络使融合图像包含更多的场景细节和更丰富的纹理细节。在TNO数据集上对提出的融合框架进行了评估实验,实验结果表明本文方法所得融合图像目标区域显著,细节纹理丰富,具有更优的融合性能和更强的泛化能力,主观性能和客观评价优于其他对比方法。 展开更多
关键词 红外与可见光图像融合 多尺度对比度增强 跨模态交互注意力机制 分解网络
在线阅读 下载PDF
基于自适应差异化图卷积的图注意力网络表示学习算法
13
作者 吴誉兰 舒建文 《现代电子技术》 北大核心 2025年第2期51-54,共4页
为解决传统图卷积网络在处理节点间复杂关系时存在的局限性,提出一种基于自适应差异化图卷积的图注意力网络表示学习算法。采用差异化图卷积网络,依据每个节点自身特征和邻居信息进行差异化采样,捕捉节点间的复杂关系;再结合二阶段关键... 为解决传统图卷积网络在处理节点间复杂关系时存在的局限性,提出一种基于自适应差异化图卷积的图注意力网络表示学习算法。采用差异化图卷积网络,依据每个节点自身特征和邻居信息进行差异化采样,捕捉节点间的复杂关系;再结合二阶段关键相邻采样方式优先挖掘重要节点并保留随机性,完成关键邻居节点的采样;然后结合图注意力网络,通过局部关注和自适应学习权重分配将关键邻居节点特征聚合到自身节点上,增强节点的特征表示;最后经网络训练,进一步增强网络表示学习能力。实验结果表明,所提出的算法优化了节点聚合程度和边界清晰度,提高了节点分类的准确性和可视化效果,并且通过关注二阶邻居和使用双头注意力,在网络表示学习上也展现出了优越性能。 展开更多
关键词 网络表示学习 图卷积网络 自适应差异化机制 节点采样 特征聚合 网络训练 注意力网络
在线阅读 下载PDF
复杂场景下自适应注意力机制融合实时语义分割
14
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
在线阅读 下载PDF
基于注意力机制与多尺度融合的PCB缺陷检测 被引量:4
15
作者 陆维宽 周志立 +1 位作者 阮秀凯 聂赛赛 《无线电工程》 2024年第1期6-13,共8页
针对印制电路板(PCB)缺陷区域受背景干扰过多以及缺陷目标尺度较小导致缺陷检测精度低的问题,提出了一种基于注意力机制与多尺度融合的PCB缺陷检测方法。在YOLOv5模型的特征提取网络中,引入一种三维注意力模块,以增强缺陷目标特征的显著... 针对印制电路板(PCB)缺陷区域受背景干扰过多以及缺陷目标尺度较小导致缺陷检测精度低的问题,提出了一种基于注意力机制与多尺度融合的PCB缺陷检测方法。在YOLOv5模型的特征提取网络中,引入一种三维注意力模块,以增强缺陷目标特征的显著度,使模型更加注重目标特征;为充分利用微小缺陷目标的多尺度特征,在特征融合网络中引入加权双向特征金字塔网络(Bi-directional Feature Pyramid Network, BiFPN),减少缺陷目标特征信息的丢失,提高模型对微小缺陷目标的检测精度。实验结果表明,该方法能够准确检测出PCB图像中的缺陷目标,在保证实时性的同时,较原方法的平均检测精度提高了3.9%,表明了该方法的有效性。 展开更多
关键词 印制电路板 缺陷检测 YOLOv5 注意力机制 多尺度融合
在线阅读 下载PDF
注意力机制下的多尺度图像超分辨率重建 被引量:1
16
作者 何启琛 何蕾 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第9期1255-1261,共7页
文章结合目前较流行的多尺度卷积和通道注意力机制,提出一种新颖的卷积神经网络(convolutional neural network,CNN)结构,即注意力机制下的多尺度卷积神经网络。该网络结构中加入大量的残差结构,加深了网络的深度;多尺度卷积的使用使该... 文章结合目前较流行的多尺度卷积和通道注意力机制,提出一种新颖的卷积神经网络(convolutional neural network,CNN)结构,即注意力机制下的多尺度卷积神经网络。该网络结构中加入大量的残差结构,加深了网络的深度;多尺度卷积的使用使该网络能从图片中提取更加丰富的信息;注意力机制的引入使网络处理高频信息时有更大的权重。实验结果表明,多尺度注意力机制卷积神经网络在图像超分辨率(super-resolution,SR)重建上取得了良好的表现,图像细节恢复效果令人满意。 展开更多
关键词 超分辨率(SR) 深度学习 卷积神经网络(CNN) 注意力机制 多尺度
在线阅读 下载PDF
基于注意力机制改进YOLO-V5的多尺度行人目标检测 被引量:1
17
作者 杨旭睿 冯宇平 +2 位作者 李悦 陶康达 戴家康 《青岛科技大学学报(自然科学版)》 CAS 2024年第5期127-134,共8页
为了提高在各类复杂场景中不同尺度行人目标的检测性能,提出了一种结合注意力机制的YOLO-V5多尺度改进算法。通过对YOLO-V5主干网络进行加深,进一步提高其特征提取能力,丰富深层语义信息;在算法中引入Coordinate Attention注意力机制,... 为了提高在各类复杂场景中不同尺度行人目标的检测性能,提出了一种结合注意力机制的YOLO-V5多尺度改进算法。通过对YOLO-V5主干网络进行加深,进一步提高其特征提取能力,丰富深层语义信息;在算法中引入Coordinate Attention注意力机制,使其能够关注输入特征图中的有效区域;在原始YOLO-V5基础之上,增加一组新的目标检测头部,来增强算法对小尺度目标的检测性能。所提出的方法在Citypersons行人数据集上进行了实验,将Citypersons验证集中的不同尺度目标细分为3种后,改进算法对这3种不同尺度行人目标的AP50指标分别达到了64.5%、66.6%、71.7%,Recall指标分别达到了53.0%、56.6%、61.7%,较原始YOLO-V5算法分别提高了3.8%、3.6%、2.3%和3.3%、4.7%、3.5%。实验结果表明,提出算法对多尺度行人目标的检测效果具有明显提升。 展开更多
关键词 行人目标检测 YOLO-V5 多尺度目标检测 注意力机制
在线阅读 下载PDF
融合多尺度特征表示和注意力机制的步态识别模型
18
作者 曹子康 裴颂文 黄立波 《上海理工大学学报》 CAS CSCD 北大核心 2024年第6期589-599,共11页
针对步态识别模型在特征表示粒度和时空依赖建模的不足,提出了一种融合多尺度特征表示和注意力机制的步态识别模型。该模型包含两个关键模块:多尺度特征融合网络(multi-scale features fusion network,MFFN)和步态注意力融合模块(gait a... 针对步态识别模型在特征表示粒度和时空依赖建模的不足,提出了一种融合多尺度特征表示和注意力机制的步态识别模型。该模型包含两个关键模块:多尺度特征融合网络(multi-scale features fusion network,MFFN)和步态注意力融合模块(gait attention fusion module,GAFM)。其中,MFFN通过多尺度、多粒度特征融合提高特征表示的丰富性和判别力;GAFM通过自适应地关注步态序列中的关键帧和重要区域,从而有效地建模长期时空依赖关系。在3个数据集CASIA-B,CASIA-B^(*)和OUMVLP上的实验结果表明,该模型在多种复杂条件下均优于现有模型,相较于基准模型,平均识别率分别提升了0.9%,0.3%和0.6%。 展开更多
关键词 步态识别 多尺度特征 注意力机制 时空依赖 特征融合
在线阅读 下载PDF
基于多尺度特征与注意力机制的宫颈病变检测
19
作者 冯婷 应捷 +1 位作者 杨海马 李芳 《电子科技》 2024年第10期30-39,共10页
宫颈上皮内瘤变(Cervical Intraepithelial Neoplasm,CIN)是宫颈浸润癌变相关度较高的癌前病变,准确检测CIN并对其分类处理有利于减少宫颈癌重症率。针对宫颈病变检测与分类准确率低等问题,文中提出一种融合多尺度特征与多注意力机制的Y... 宫颈上皮内瘤变(Cervical Intraepithelial Neoplasm,CIN)是宫颈浸润癌变相关度较高的癌前病变,准确检测CIN并对其分类处理有利于减少宫颈癌重症率。针对宫颈病变检测与分类准确率低等问题,文中提出一种融合多尺度特征与多注意力机制的YOLOv5-CBTR(You Only Look Once version 5-Convolutional Block Transformer)宫颈病变图像检测方法。主干网络采用带有SENet(Squeeze-and-Excitation Networks)注意力机制的SE-CSP(SENet-BottleneckCSP)进行特征提取。引入Transformer编码器模块,融合多特征信息并放大,采用多头注意力机制增强病变区域的特征提取能力。在特征融合层引入卷积注意力模块,多尺度融合病变特征信息。在边界回归框计算中引入幂变换,加快模型损失函数的收敛,整体实现宫颈病变的检测与分类。实验结果表明,YOLOv5-CBTR模型对RGB(白光)宫颈病变图像检测与分类的准确率、召回率、mAP(mean Average Precision)和F值分别为93.99%、92.91%、92.80%和93.45%,在多光谱宫颈图像检测与分类中模型的mAP值和F值分别为97.68%和95.23%。 展开更多
关键词 宫颈图像 病变检测 多尺度特征 注意力机制 多光谱图像 编码器模块 幂变换 深度学习
在线阅读 下载PDF
基于多尺度注意力机制的实时激光雷达点云语义的分割
20
作者 张晨 刘畅 +2 位作者 赵津 王广玮 许庆 《汽车安全与节能学报》 CAS CSCD 北大核心 2024年第4期591-601,共11页
为既能提高分割精度,又能克服车载计算资源局限,提出一种面向移动机器人平台的车载实时点云语义分割方法,并进行了综合实验。该方法采用基于投影的激光雷达语义分割方法,将三维点云投影到球面图像,并结合二维卷积进行分割。引入多头注... 为既能提高分割精度,又能克服车载计算资源局限,提出一种面向移动机器人平台的车载实时点云语义分割方法,并进行了综合实验。该方法采用基于投影的激光雷达语义分割方法,将三维点云投影到球面图像,并结合二维卷积进行分割。引入多头注意力机制(MHSA),实现轻量级语义分割模型,以一种全新的方式,将一种深度学习模型架构Transformer映射到卷积。将Transformer的MHSA迁移至卷积,以形成多尺度自注意力机制(MSSA)。结果表明:与当前主流方法CENet、FIDNet、PolarNet相比,本方法在NVIDIA JETSON AGX Xavier计算平台上保持了较高的分割精度(平均交并比为63.9%)及较高的检测速率(41帧/s),从而证明了其对移动机器人平台的适用性。 展开更多
关键词 移动机器人平台 激光雷达(LiDAR) 点云 多尺度注意力机制(MSSA) 语义分割方法TRANSFORMER 卷积神经网络
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部