期刊文献+
共找到1,381篇文章
< 1 2 70 >
每页显示 20 50 100
基于注意力机制和多尺度融合的人群计数网络
1
作者 栾方军 龚琪 袁帅 《计算机工程》 北大核心 2025年第3期352-361,共10页
为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),... 为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),将主干网络中不同层次的特征进行跨尺度融合,融合后的特征包含了不同尺度的语义信息,可以更好地适应人群计数任务中的尺度变化问题。接着为了更好地解决人群计数中存在的挑战,设计一个多尺度注意力模块(MSAM),根据不同感受野的分支提取不同尺度的特征,利用选择性Kernel通道注意力(SKCA)缓解多列结构存在的特征相似问题,并将模块生成的注意力图反馈到对应的尺度特征中,以抑制背景的干扰。网络模型在ShanghaiTechA数据集中的平均绝对误差(MAE)和均方根误差(RMSE)分别达到了56.1和93.9;在ShanghaiTechB数据集中的MAE和RMSE分别达到了6.1和10.3;在UCF_CC_50数据集中的MAE和RMSE分别达到了174.9和252.7;在Mall数据集中的MAE和RMSE分别达到了1.42和1.85。在公开数据集上的实验结果表明,提出的网络模型与现有代表性的人群计数方法相比,在提升人群计数任务的准确性和鲁棒性方面均取得了明显进展。 展开更多
关键词 人群计数 多尺度特征融合 注意力机制 神经网络 密度图
在线阅读 下载PDF
融合多尺度注意力神经网络的港口起重装备故障时序数据预测方法 被引量:1
2
作者 雷鹏 谢敬玲 +4 位作者 许洪祖 焦锋 魏立明 张忠岩 吕成兴 《机电工程》 北大核心 2025年第2期277-286,共10页
近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注... 近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注意力机制港口装备故障时序数据预测方法。首先,采用了融合非线性策略与混沌映射的改进灰狼优化算法(IGWO),自适应地确定了变分模态分解(VMD)的模态数与惩罚因子;然后,将变分模态分解得到的本征模态函数进一步作为融合多尺度注意力神经网络(FMANN)模型的时序输入,进行了多尺度通道特征融合;最后,对各个本征模态函数的预测结果进行了融合,得到了最终预测结果。研究结果表明:FMANN模型在回转机构数据集上的均方根误差(RMSE)为0.001 12,平均绝对百分比误差(MAPE)为6.396 3%,决定系数为0.999 8;相比于其他预测模型,FMANN预测效果更加拟合实际数据。FMANN模型能够准确地预测设备轴承的时序振动,有望为未来实际工业生产提供一条新思路。 展开更多
关键词 滚动轴承 故障诊断 变分模态分解 注意力机制 灰狼优化算法 融合多尺度注意力神经网络 深度可分离卷积
在线阅读 下载PDF
坐标注意力及卷积增强的全尺度融合建筑物提取网络
3
作者 何锐利 乐伟鹏 +1 位作者 俞友 黄亮 《科学技术与工程》 北大核心 2025年第18期7485-7492,共8页
建筑物作为人类生产活动的重要载体,准确快速地提取建筑物可在自然资源管理领域发挥重要作用。基于卷积神经网络(convolutional neural network, CNN)在遥感影像建筑物提取方面取得了重大进展,但构建的网络模型在特征提取和特征融合方... 建筑物作为人类生产活动的重要载体,准确快速地提取建筑物可在自然资源管理领域发挥重要作用。基于卷积神经网络(convolutional neural network, CNN)在遥感影像建筑物提取方面取得了重大进展,但构建的网络模型在特征提取和特征融合方面仍有待优化。因此,提出了一种坐标注意力及卷积增强的全尺度融合建筑物提取网络(coordinate attention and convolutional enhanced full-scale fusion building extraction network, CCFNet)。所构建的模型由坐标注意力及卷积增强的残差编码器和全尺度融合解码器组成。编码器使用坐标注意力构建通道间的依赖关系并捕获的全局信息,其使用的非对称卷积增强地物边缘特征提取,并对旋转、翻转扭曲及纵横比不均匀的地物有更强的鲁棒性。解码器使用的全尺度融合方法则有助于建筑物的重建。在中国典型城市建筑物实例数据集实验结果表明,相比于其他建筑物提取网络,本文构建的CCFNet模型在Accuracy、F_(1)、IOU和MIOU共4种分割评价指标分别取得了93.84%、84.08%、72.53%和82.59%的最优实验精度。结果表明,该模型能够有效地提取建筑物区域。 展开更多
关键词 坐标注意力 尺度融合 建筑物提取 非对称卷积
在线阅读 下载PDF
基于GAN和多尺度空间注意力的多模态医学图像融合 被引量:3
4
作者 林予松 李孟娅 +1 位作者 李英豪 赵哲 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期1-8,共8页
针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图... 针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图像;其次,整个对抗网络框架采用双鉴别器结构,使得生成器生成的融合图像同时保留多个模态图像的显著特征;最后,构建一种多尺度空间注意力作为编码器进行特征提取的基本模块,利用多尺度结构充分捕获并保留源图像的多尺度特征,并且引入空间注意力更好地保留源图像的结构和细节信息。全脑图谱数据库上的实验结果表明:所提算法生成的融合图像不仅纹理细节更为丰富,有助于人类视觉观察,而且在3种不同类型的医学图像融合任务上平均梯度、峰值信噪比、互信息、视觉信息保真度等客观评价指标的平均值分别达到0.3023、20.7207、1.4414、0.6498,与其他先进的算法相比具有一定的优势。 展开更多
关键词 图像融合 多模态医学图像 生成对抗网络 特征金字塔 注意力机制
在线阅读 下载PDF
基于多尺度特征融合和时空注意力LSTM的台风云图预测研究
5
作者 程勇 钱坤 +5 位作者 王军 渠海峰 李伟 杨玲 韩晓东 刘敏 《海洋预报》 北大核心 2025年第2期89-98,共10页
现有深度学习方法在预测台风时没有考虑其特征内化损失问题,难以全面捕捉台风结构变化。为此,本文提出一种基于多尺度特征融合的时空注意力长短期记忆网络(MSTA-LSTM)方法。引入特征增强模块加强台风特征信息,通过跳跃连接缓解编解码过... 现有深度学习方法在预测台风时没有考虑其特征内化损失问题,难以全面捕捉台风结构变化。为此,本文提出一种基于多尺度特征融合的时空注意力长短期记忆网络(MSTA-LSTM)方法。引入特征增强模块加强台风特征信息,通过跳跃连接缓解编解码过程中的台风细节特征损失,同时在时空长短期记忆网络(ST-LSTM)单元中利用卷积块注意力模块优化信息传递,最后通过反卷积调整不同尺度的解码输出,融合后输出结果。使用“葵花8号”卫星获取的东亚—东南亚太平洋沿岸地区的台风云图数据集开展验证和消融实验,该数据集包含16个台风过程的训练集和3个台风过程的测试集。与其他网络相比,MSTA-LSTM网络的均方根误差、峰值信噪比和结构相似性指数指标分别为42.76、16.38和0.4817,有效提高了台风云图预测的准确性。 展开更多
关键词 时间序列预测 多尺度特征 时空长短期记忆网络 注意力机制
在线阅读 下载PDF
多尺度注意力网络的水下图像增强算法
6
作者 陈海秀 陆康 +2 位作者 何珊珊 刘磊 颜秋叙 《机械科学与技术》 北大核心 2025年第3期505-512,共8页
针对水下环境中的图像存在严重的偏色、模糊等问题,该文提出了一种新型的生成对抗网络。采用U-Net作为生成网络的基础模型并对其进行了改进,首先将注意力机制引入到网络中,并设计多尺度特征提取模块,来提取不同层次的特征。其次通过预... 针对水下环境中的图像存在严重的偏色、模糊等问题,该文提出了一种新型的生成对抗网络。采用U-Net作为生成网络的基础模型并对其进行了改进,首先将注意力机制引入到网络中,并设计多尺度特征提取模块,来提取不同层次的特征。其次通过预处理操作输入白平衡图像提升模型的鲁棒性。为解决单一损失造成图像细节恢复不均匀的问题,在传统的对抗损失函数中联合L1损失与内容损失。实验结果表明:此方法在水下图像的颜色恢复和提高清晰度方面具有很好的效果,其中结构相似度、峰值信噪比、水下彩色质量评估和水下图像质量度量的平均值分别为0.8906、29.0761、0.4454和3.1810。在主观评价和客观评价指标上,综合来说该文算法实验结果均优于对比算法。 展开更多
关键词 水下图像增强 生成对抗网络 注意力机制 多尺度
在线阅读 下载PDF
基于多尺度通道注意力卷积神经网络的轴向柱塞泵故障诊断研究
7
作者 刘增光 张帅迪 +3 位作者 周焱 魏列江 岳大灵 冯珂 《机床与液压》 北大核心 2025年第14期124-130,共7页
针对传统多尺度卷积神经网络对不同尺度的特征只是简单拼接而未考虑特征差异的问题,提出一种基于多尺度通道注意力卷积神经网络(MSCA-CNN)的轴向柱塞泵故障诊断方法。在轴向柱塞泵实验平台上设置5种典型故障(配流盘磨损、斜盘磨损、滑... 针对传统多尺度卷积神经网络对不同尺度的特征只是简单拼接而未考虑特征差异的问题,提出一种基于多尺度通道注意力卷积神经网络(MSCA-CNN)的轴向柱塞泵故障诊断方法。在轴向柱塞泵实验平台上设置5种典型故障(配流盘磨损、斜盘磨损、滑靴磨损、松靴故障、中心弹簧失效),采集6种工作状态(正常状态及5种典型故障)下的z轴振动信号。以小波变换为信号预处理模块,将加速度传感器采集的一维振动信号转化为时频图并作为诊断模型的输入信号,采用不同尺度的卷积核对时频图进行特征提取。通过通道注意力为每个通道赋予不同的权重值,使模型能够集中学习与通道密切相关的特征信息,从而提高轴向柱塞泵的故障分类能力和诊断的效率。搭建轴向柱塞泵故障诊断实验平台,验证所提方法的有效性。结果表明:该模型对6种工作状态的诊断准确率达到99.65%,相比传统多尺度卷积神经网络模型提高了3.16%,验证了MSCA-CNN模型在轴向柱塞泵故障诊断中的优越性。 展开更多
关键词 故障诊断 卷积神经网络 通道注意力 多尺度特征 柱塞泵
在线阅读 下载PDF
融合多尺度特征与注意力的小样本目标检测
8
作者 张英俊 甘望阳 +1 位作者 谢斌红 张睿 《小型微型计算机系统》 北大核心 2025年第3期689-696,共8页
针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatia... 针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatial Pyramid Pooling)模块获取不同的感受野,以捕获目标细节信息的多尺度特征.其次,采用Bi-FPN网络进行多尺度特征融合,获得更具代表性的查询特征与支持特征,有效缓解尺度变化问题.然后,利用提出的注意力引导特征增强模块对查询特征与支持特征进行自身关注,使得它们具有更好的判别能力,由此促进查询特征与支持特征的融合,以更好地应对外观变化和遮挡带来的挑战,从而缓解误检、漏检问题.最后,将分类头与边界框回归头进行解耦,分别对RPN网络基于细粒度查询特征产生的候选区域进行目标分类与目标定位.在PASCAL VOC与MS COCO数据集上的实验结果表明,所提模型的检测性能优于主流的小样本目标检测模型,相较于基线模型DCNet,mAP平均分别提升了3.5%与2.1%. 展开更多
关键词 小样本学习 元学习 目标检测 多尺度特征融合 注意力机制
在线阅读 下载PDF
动静图融合和时序流注意力网络用于交通流预测
9
作者 闫敬 王祥 郑铮 《兵工自动化》 北大核心 2025年第5期66-70,共5页
为准确预测交通流量有利于优化交通管理、提高交通效率的问题,提出一种新的动静态图融合和时序流注意力网络。通过图卷积网络捕捉动态和静态的空间相关性,引入流注意力机制,有效缓解二次复杂度问题;设计时间相关性建模(temporal correla... 为准确预测交通流量有利于优化交通管理、提高交通效率的问题,提出一种新的动静态图融合和时序流注意力网络。通过图卷积网络捕捉动态和静态的空间相关性,引入流注意力机制,有效缓解二次复杂度问题;设计时间相关性建模(temporal correlation modeling,TCM)模块替换流注意力机制的线性变换方法,以增强模型的时序建模能力。在4个真实世界的交通数据集上进行了大量实验。实验结果表明:所提出的模型具有优越的性能,并且明显优于基线。 展开更多
关键词 交通流预测 时空相关性 注意力机制 图卷积网络 特征融合
在线阅读 下载PDF
基于注意力尺度序列融合的车辆行人检测算法
10
作者 李军 邹军 +1 位作者 陈翠 张世义 《重庆交通大学学报(自然科学版)》 北大核心 2025年第7期75-82,共8页
针对在路侧端车辆与行人检测中存在检测精度低,漏检率较高等问题,提出了一种注意力尺度序列融合的车辆行人检测算法YOLOv8-APC。首先,在颈部网络中使用尺度序列融合模块SSFF与三特征编码器TFE,以增强对多尺度信息的提取与融合,同时引入... 针对在路侧端车辆与行人检测中存在检测精度低,漏检率较高等问题,提出了一种注意力尺度序列融合的车辆行人检测算法YOLOv8-APC。首先,在颈部网络中使用尺度序列融合模块SSFF与三特征编码器TFE,以增强对多尺度信息的提取与融合,同时引入通道与位置注意力机制CPAM提高检测精度。然后,在改进后的网络结构基础上增加P2检测层,提高对小目标的检测能力,降低漏检率。最后,在主干网络中应用C2f_GhostDynamicConv(C2f_GDC)模块,有效降低模型的复杂度。为验证算法的有效性,在重庆科学谷示范区路侧端数据集Vapddsits上进行验证,实验结果表明:YOLOv8-APC的mAP50值与召回率较原模型提升了11.1%、11.9%;参数量与模型体积分别仅有1.85 M、4.1 MB,分别较原模型下降了38.3%、34.9%,其对远距离小目标以及遮挡目标能够实现更为准确的检测,且不会占用过多的内存资源,为路侧端车辆行人检测提供了一种解决方案。 展开更多
关键词 交通运输工程 YOLOv8 车辆与行人 特征提取 注意力机制 尺度序列融合
在线阅读 下载PDF
融合时空注意力机制的多尺度卷积车辆轨迹预测
11
作者 闫建红 刘芝妍 王震 《计算机工程》 北大核心 2025年第8期406-414,共9页
车辆轨迹预测是自动驾驶的重要环节,提升车辆轨迹预测的可靠性和准确性对自动驾驶安全性有很大帮助。道路上车辆行驶受交通环境影响,考虑相邻车辆运动和相对空间位置等交通环境因素,在长短期记忆(LSTM)神经网络编码器-解码器模型基础上... 车辆轨迹预测是自动驾驶的重要环节,提升车辆轨迹预测的可靠性和准确性对自动驾驶安全性有很大帮助。道路上车辆行驶受交通环境影响,考虑相邻车辆运动和相对空间位置等交通环境因素,在长短期记忆(LSTM)神经网络编码器-解码器模型基础上引入时空注意力机制,通过时间注意力层关注目标车辆和相邻车辆的历史轨迹,空间注意力层关注车辆的相对空间位置。为了增强特征提取程度和实现更全面的特征融合,使用多尺度卷积社交池增大感受野,融合多尺度特征,并提出基于LSTM编码器-解码器架构融合多尺度卷积社交池和时空注意力机制的车辆轨迹预测模型MCS-STA-LSTM。通过学习车辆运动相互依赖关系,以达到获得目标车辆未来轨迹基于机动类别的多模态预测分布的目的。在公开数据集NGSIM上进行训练、验证和测试,实验结果表明,相较于其他轨迹预测模型,该方法在3 s内的均方根误差平均降低了9.35%,5 s内均方根误差平均降低了5.53%,提高了轨迹预测准确性,在中短期预测上更具有优势。 展开更多
关键词 多尺度卷积社交池化 轨迹预测 长短期记忆神经网络 时空注意力机制 多尺度特征融合
在线阅读 下载PDF
多尺度密集交互注意力残差真实图像去噪网络
12
作者 郭业才 胡晓伟 +1 位作者 AMITAVE Saha 毛湘南 《图学学报》 北大核心 2025年第2期279-287,共9页
针对图像去噪特征提取不全面以及特征利用率低,导致生成图像不够清晰的问题,提出一种多尺度密集交互注意力残差去噪网络(MDIARN)。首先,通过多尺度非对称特征提取模块(MAFM)初步提取浅层信息特征,以确保图像特征的多样性;然后,多尺度级... 针对图像去噪特征提取不全面以及特征利用率低,导致生成图像不够清晰的问题,提出一种多尺度密集交互注意力残差去噪网络(MDIARN)。首先,通过多尺度非对称特征提取模块(MAFM)初步提取浅层信息特征,以确保图像特征的多样性;然后,多尺度级联模块(MSCM)利用多维密集交互残差单元(MDIU)对图像特征进行多维映射,并逐步级联以增强模型之间的信息传递和交互性,充分拟合训练数据;引入双路全局注意力模块(DGAM)对多级特征进行全局联合学习,获取更具有判别性的特征信息;跳跃连接促进结构之间的参数共享,使不同维度的特征充分融合,保证信息的完整性;最后,采用残差学习构建出清晰的去噪图像。结果表明,该算法在真实噪声数据集(DND和SIDD)上峰值信噪比分别为39.80 dB和39.62 dB,结构相似性分别为95.4%和95.8%,均优于主流去噪算法。此外,该算法在低光度场景下应用也能保留更多细节,从而显著提升图像质量。 展开更多
关键词 图像去噪 多尺度特征提取 多维密集交互 卷积神经网络 注意力
在线阅读 下载PDF
基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离
13
作者 王春丽 刘素倩 陈善立 《信号处理》 北大核心 2025年第4期718-729,共12页
针对在含有噪声和混响的复杂环境中对未知说话人语音分离任务的研究,提出了一种基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离模型。现有的针对未知说话人的语音分离模型是在纯净的实验环境条件下分析的模型性能,不符合... 针对在含有噪声和混响的复杂环境中对未知说话人语音分离任务的研究,提出了一种基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离模型。现有的针对未知说话人的语音分离模型是在纯净的实验环境条件下分析的模型性能,不符合现实中复杂的背景环境需求。为使模型可以在现实应用复杂条件下灵活应对混合语音信号中的多变性与非平稳性,采用多尺度可变形注意力机制与Transformer编码器构成(Transformer Encoder Multi-Scale deformable attention,TEMDA)模块,利用多尺度可变形注意力机制的偏移层在不同位置上进行动态计算,扩展模型的感受野,同时使模型更有效地聚焦于重要的时间点,减少噪声和混响的影响。为了更好地获取上下文信息,在多路径融合策略中,通过在双路径模块的基础上增加通道间的Conformer组成三路径模块,用于提取多说话人之间的特征信息,这样的处理方式可以更好地融合单一说话人和多说话人之间的信息,提升语音分离性能。实验表明,所提出的模型分别在纯净和带噪声的Libri2Mix、Libri3Mix数据集上达到了显著的分离效果,并且在LRS2-2Mix数据集中模型可以更好地减少噪声和混响对语音分离的影响,尺度不变信噪比改善(Scale-Invariant Signal-to-Noise Ratio Improvement,SI-SNRi)和信号失真比改善(Signal-to-Distortion Ratio Improvement,SDRi)分别为14.7 dB和15.1 dB;在三个说话人数目中的估计精度为98.89%,提升了0.12%。 展开更多
关键词 未知说话人语音分离 多尺度可变形注意力编码策略 多路径融合 吸引子估计
在线阅读 下载PDF
融合自注意力的多尺度遥感图像去模糊算法
14
作者 田旭 吕东澔 +2 位作者 张勇 任彦 李少波 《电光与控制》 北大核心 2025年第5期53-59,共7页
基于卷积神经网络的遥感图像去模糊存在感受野有限的缺陷,会导致图像在恢复过程中出现细节丢失、去模糊不彻底等问题,为此,提出一种融合自注意力的多尺度遥感图像去模糊算法。利用多输入多输出U-Net将单U-Net模拟出多级联合的多尺度卷... 基于卷积神经网络的遥感图像去模糊存在感受野有限的缺陷,会导致图像在恢复过程中出现细节丢失、去模糊不彻底等问题,为此,提出一种融合自注意力的多尺度遥感图像去模糊算法。利用多输入多输出U-Net将单U-Net模拟出多级联合的多尺度卷积操作,实现对特征的有效提取;提出一种基于Transformer的多头自注意力模块,通过嵌入到编码器与解码器中间位置来提升网络的空间特征提取和全局信息捕获能力;引入多尺度边缘损失函数,提高图像边缘细节的复原效果。构建模糊遥感图像数据集进行实验,对实验结果的定量与定性分析表明,所提算法优于对比算法。为证明该算法的泛化能力,在公开数据集GOPRO上进行了验证。研究结果表明,该算法对有效处理模糊的遥感图像具有一定的实际意义。 展开更多
关键词 遥感图像去模糊 多尺度卷积神经网络 TRANSFORMER 多头自注意力 多尺度边缘损失
在线阅读 下载PDF
结合注意力机制和多尺度特征融合的三维手部姿态估计
15
作者 郭诗月 党建武 +1 位作者 王阳萍 雍玖 《计算机应用》 北大核心 2025年第4期1293-1299,共7页
针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(S... 针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(SEM),以替换沙漏网络(HGNet)中的基本块(Basicblock),在扩大感受野的同时增强对空间信息的敏感性,从而提高手部特征的提取能力;其次,设计一种结合SPCNet(Spatial Preserve and Contentaware Network)和Soft-Attention改进的多尺度信息融合模块SS-MIFM(SPCNet and Soft-attention-Multi-scale Information Fusion Module),在充分考虑空间内容感知机制的情况下,有效地聚合多级特征,并显著提高二维手部关键点检测的准确性;最后,利用2.5D姿态转换模块将二维姿态转换为三维姿态,从而避免二维关键点坐标直接回归计算三维姿态信息导致的空间丢失问题。实验结果表明,在InterHand2.6M数据集上,所提算法的双手关节点平均误差(MPJPE)、单手MPJPE和根节点平均误差(MRRPE)分别达到了12.32、9.96和29.57 mm;在RHD(Rendered Hand pose Dataset)上,与InterNet和QMGR-Net算法相比,所提算法的终点误差(EPE)分别降低了2.68和0.38 mm。以上结果说明了所提算法能够更准确地估计手部姿态,且在一些双手交互和遮挡的场景下有更高的鲁棒性。 展开更多
关键词 手部姿态估计 多尺度特征融合 注意力机制 高分辨率网络 沙漏网络
在线阅读 下载PDF
基于多尺度图注意力网络的电力系统暂态稳定评估
16
作者 傅太国屹 杜友田 +2 位作者 吕昊 李宗翰 刘俊 《电力系统自动化》 北大核心 2025年第3期60-70,共11页
已有基于图深度学习的暂态稳定评估方法考虑了电网的拓扑结构特征,但对电网拓扑结构图中多尺度子图间的信息传递特性没有进行有效建模,导致判稳模型对电网局部与全局动态耦合关系的捕捉不足,降低了模型在复杂扰动下的判稳精度。因此,提... 已有基于图深度学习的暂态稳定评估方法考虑了电网的拓扑结构特征,但对电网拓扑结构图中多尺度子图间的信息传递特性没有进行有效建模,导致判稳模型对电网局部与全局动态耦合关系的捕捉不足,降低了模型在复杂扰动下的判稳精度。因此,提出了一种融合多尺度子图信息传递过程的功角暂态稳定评估方法。首先,提出并构建了一种k阶图注意力网络,以不同尺度的电网拓扑子图作为图深度学习中特征提取的基本单元。然后,通过注意力机制为特征聚合分配自适应权重,以挖掘实际电网中不同细粒度区域之间的特性。最后,通过CEPRI-TAS-173系统验证了所提方法的可行性和有效性。 展开更多
关键词 暂态稳定评估 深度学习 多尺度子图 特征提取 注意力网络
在线阅读 下载PDF
基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断
17
作者 章力 邓艾东 +2 位作者 王敏 卞文彬 张宇剑 《动力工程学报》 北大核心 2025年第4期571-581,共11页
针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特... 针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特征信息;同时,构建多尺度减法神经网络模型,关注层级差异;其次,引入轻量化模块,减少内存访问;然后,结合通道注意力机制,调整特征权重;最后,将故障样本输入到网络模型中,实现精确分类。利用风电机组传动系统模拟实验台采集的样本数据进行诊断任务。结果表明:该故障诊断模型能够有效克服传统多尺度卷积神经网络模型网络层数多、参数量大所带来的弊端,能够充分关注各层级之间的差异信息,减少冗余信息的提取,精确定位故障特征,缩短模型训练时间,在恒定工况、变工况和强噪声工况下都具有较高的诊断精度. 展开更多
关键词 滚动轴承 故障诊断 多尺度减法神经网络 轻量化模块 通道注意力机制 变工况
在线阅读 下载PDF
基于跨尺度注意力网络的胸部疾病分类方法
18
作者 林进浩 罗川 +1 位作者 李天瑞 陈红梅 《计算机应用》 北大核心 2025年第8期2712-2719,共8页
从胸部X光片中自动识别胸部疾病是计算机辅助诊断的重要研究领域。然而,现有的许多胸部疾病分类方法在处理病变区域大小差异方面存在困难,并且无法准确识别和定位不同疾病的病变区域。针对上述问题,提出一种基于跨尺度注意力网络(CANet... 从胸部X光片中自动识别胸部疾病是计算机辅助诊断的重要研究领域。然而,现有的许多胸部疾病分类方法在处理病变区域大小差异方面存在困难,并且无法准确识别和定位不同疾病的病变区域。针对上述问题,提出一种基于跨尺度注意力网络(CANet)的胸部疾病分类方法。该方法使用DenseNet-121作为特征提取网络,并集成自感知注意力(SAA)、向上聚焦注意力(UFA)和向下引导注意力(DGA)3个主要模块。SAA模块通过提取与胸部疾病相关的通道和异常区域信息,细化空间位置上的病理特征,并减少不相关区域的干扰。为了实现不同尺度空间上下文信息的跨尺度交互,使用UFA和DGA模块进行图像特征校准。此外,提出空间注意力金字塔池化(SAPP)模块用于融合不同特征图的多尺度特征,从而提高胸部疾病的检测性能。在ChestX-ray14和DR-Pneumonia数据集上的实验结果表明,所提方法的平均曲线下面积(AUC)值分别达到了83.4%和82.6%,优于DualCheXNet、A3Net和CheXGAT等方法。具体地,与CheXGAT方法相比,所提方法的平均AUC值分别提高了0.7和0.1个百分点。可见,所提方法可以识别胸部X光片中的重要信息,有效提高了胸部疾病分类的性能。 展开更多
关键词 胸部疾病分类 胸部X光片 注意力机制 卷积神经网络 特征融合
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的视频异常检测方法
19
作者 吴祥 肖剑 吉根林 《应用科学学报》 北大核心 2025年第2期234-244,共11页
视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限... 视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限制了其异常检测的性能。针对该问题,本文基于生成对抗网络结构,提出了一种基于多尺度特征融合和注意力机制的视频异常检测方法。使用大小不同的卷积核捕获不同感受野的特征,并将它们进行融合以获得多尺度的特征表示。此外,在生成器的转置卷积层后引入坐标注意力机制,自适应分配特征图权重,从而增强模型对关键特征的感知能力。在公开数据集UCSD Ped2和Avenue上的实验结果表明,本文方法的性能优于其他同类方法。 展开更多
关键词 视频异常检测 深度学习 生成对抗网络 多尺度特征融合 注意力机制
在线阅读 下载PDF
多尺度融合与注意力机制的生丝条干与疵点提取算法
20
作者 胡涛涛 孙卫红 +1 位作者 梁曼 邵铁锋 《中国测试》 北大核心 2025年第5期148-154,161,共8页
动态采集生丝图像时生丝微小抖动会造成生丝图像模糊,为解决现有生丝图像分割算法对模糊生丝条干与边缘疵点分割效果不佳的问题,以U-Net作为主干特征提取网络,提出一种基于多尺度融合与注意力机制的生丝条干与疵点分割算法。首先,将生... 动态采集生丝图像时生丝微小抖动会造成生丝图像模糊,为解决现有生丝图像分割算法对模糊生丝条干与边缘疵点分割效果不佳的问题,以U-Net作为主干特征提取网络,提出一种基于多尺度融合与注意力机制的生丝条干与疵点分割算法。首先,将生丝原始特征图进行空间与通道上的双路注意力抓取,增强网络对丝干与疵点等有效特征的提取能力。其次,通过编码器浅层嵌入的边缘定位模块获取细粒度的生丝边缘细节信息,将其输入到解码器特征融合模块进行不同网络层级的多尺度特征融合。最后,引入Lovsz-Softmax损失函数进行数据均衡,生成分割概率图后得到分割图像。实验结果表明,与现有生丝分割算法相比,该算法对模糊生丝条干有明显的分割优势,且生丝边缘疵点的分割准确率、特异性、敏感度分别达到98.26%,99.54%,84.31%;相比于原始U-Net网络,各指标分别提升2.59%,1.35%,5.87%。 展开更多
关键词 生丝 模糊条干 边缘疵点 注意力机制 多尺度融合 语义分割
在线阅读 下载PDF
上一页 1 2 70 下一页 到第
使用帮助 返回顶部