期刊文献+
共找到873篇文章
< 1 2 44 >
每页显示 20 50 100
基于Transformer的多尺度分组空洞自注意力机制在复杂场景分割方面的研究
1
作者 韩昌 朱祯琳 +2 位作者 柴欣灵 王润民 熊正强 《高技术通讯》 北大核心 2025年第8期847-860,共14页
针对基于复杂场景的图像处理所存在的不同分割场景、定位困难、超负荷的计算量等挑战,本文提出了一种基于Transformer的多尺度分组空洞自注意力机制,通过在进行局部的分组层面上以非倍数的形式进行空洞自注意力机制的注意力提取,并避免... 针对基于复杂场景的图像处理所存在的不同分割场景、定位困难、超负荷的计算量等挑战,本文提出了一种基于Transformer的多尺度分组空洞自注意力机制,通过在进行局部的分组层面上以非倍数的形式进行空洞自注意力机制的注意力提取,并避免了棋盘效应;同时使用局部增强位置编码(local-enhanced positional encoding,LePE)进行局部位置编码信息的处理;在局部自注意力之间使用边缘自注意力机制提取,并与组间自注意力机制提取进一步融合,随后使用条件位置编码(conditional positional encodings,CPE)进行全局位置信息的再次整合,以增强对于图像特征提取的准确性。本文所提出的方法分别在图像分类、行人重识别、语义分割数据集上进行了相应的实验。本文所提出的基于Transformer的多尺度分组空洞自注意力机制在图像分类ImageNet数据集、行人重识别Market-1501和MSMT17数据集、语义分割ADE20K和Cityscapes数据集上取得了与当前多数典型架构相当的性能。在多个公共数据集上进行的相关实验,充分验证了本文方法的有效性,并为未来图像处理的技术研究提供了更多思考的前沿方向。 展开更多
关键词 TRANSFORMER 多尺度特征 注意力机制 行人重识别 语义分割
在线阅读 下载PDF
融合时空注意力机制的多尺度卷积车辆轨迹预测 被引量:1
2
作者 闫建红 刘芝妍 王震 《计算机工程》 北大核心 2025年第8期406-414,共9页
车辆轨迹预测是自动驾驶的重要环节,提升车辆轨迹预测的可靠性和准确性对自动驾驶安全性有很大帮助。道路上车辆行驶受交通环境影响,考虑相邻车辆运动和相对空间位置等交通环境因素,在长短期记忆(LSTM)神经网络编码器-解码器模型基础上... 车辆轨迹预测是自动驾驶的重要环节,提升车辆轨迹预测的可靠性和准确性对自动驾驶安全性有很大帮助。道路上车辆行驶受交通环境影响,考虑相邻车辆运动和相对空间位置等交通环境因素,在长短期记忆(LSTM)神经网络编码器-解码器模型基础上引入时空注意力机制,通过时间注意力层关注目标车辆和相邻车辆的历史轨迹,空间注意力层关注车辆的相对空间位置。为了增强特征提取程度和实现更全面的特征融合,使用多尺度卷积社交池增大感受野,融合多尺度特征,并提出基于LSTM编码器-解码器架构融合多尺度卷积社交池和时空注意力机制的车辆轨迹预测模型MCS-STA-LSTM。通过学习车辆运动相互依赖关系,以达到获得目标车辆未来轨迹基于机动类别的多模态预测分布的目的。在公开数据集NGSIM上进行训练、验证和测试,实验结果表明,相较于其他轨迹预测模型,该方法在3 s内的均方根误差平均降低了9.35%,5 s内均方根误差平均降低了5.53%,提高了轨迹预测准确性,在中短期预测上更具有优势。 展开更多
关键词 多尺度卷积社交池化 轨迹预测 长短期记忆神经网络 时空注意力机制 多尺度特征融合
在线阅读 下载PDF
基于格点网格与段尺度注意力机制的知识图谱构建
3
作者 王体春 李昊 王贤伟 《计算机集成制造系统》 北大核心 2025年第4期1368-1382,共15页
为解决当前知识图谱构建模型过程中训练样本特征单一、关系抽取准确率低下的问题,建立一种基于格点网格与段尺度注意力机制的知识图谱自动构建模型(KG-GSAM)。针对实体识别任务,引入格点网格结构对双向门控循环神经网络进行改进;针对关... 为解决当前知识图谱构建模型过程中训练样本特征单一、关系抽取准确率低下的问题,建立一种基于格点网格与段尺度注意力机制的知识图谱自动构建模型(KG-GSAM)。针对实体识别任务,引入格点网格结构对双向门控循环神经网络进行改进;针对关系抽取任务,引入段尺度注意力机制,搭建关系抽取神经网络。在公开数据集和近三年自动导引车领域的专利文本构建的数据集上分别进行实验,结果表明所建立模型在Precision、Recall和F1-score三个指标上与其他知识图谱构建模型相比有一定的优越性。 展开更多
关键词 知识图谱 格点网格 尺度注意力机制 BERT模型 关系抽取神经网络 自动导引车
在线阅读 下载PDF
MDA-MIM:一种融合多尺度特征与双重注意力机制的雷达回波图预测模型
4
作者 胡强 高雅婷 +1 位作者 尹宾礼 渠连恩 《通信学报》 北大核心 2025年第3期248-257,共10页
为提升雷达回波图中时空特征的提取质量,提出了一种基于多尺度特征融合和双重注意力机制的MIM改进(MDA-MIM)模型。该模型基于空洞卷积实现多尺度特征提取与融合。通过在MIM模型中的非平稳模块集成自注意力机制,调整不同时间步长和空间... 为提升雷达回波图中时空特征的提取质量,提出了一种基于多尺度特征融合和双重注意力机制的MIM改进(MDA-MIM)模型。该模型基于空洞卷积实现多尺度特征提取与融合。通过在MIM模型中的非平稳模块集成自注意力机制,调整不同时间步长和空间位置的权重,更精确地捕捉雷达回波数据中的非平稳性特征。在平稳模块引入局部注意力机制,以聚焦于局部区域内的特征关联,增强对平稳性特征的捕捉能力。真实数据集上的实验结果表明,MDA-MIM具有优秀的预测性能,在MSE、MAE、SSIM和PSNR等指标上均优于对比模型。 展开更多
关键词 雷达回波图 时空预测 注意力机制 多尺度特征
在线阅读 下载PDF
融合注意机制的多尺度自适应空洞卷积面部情感识别方法
5
作者 王春影 孟天宇 +2 位作者 张震 葛雄心 杨继伟 《重庆理工大学学报(自然科学)》 北大核心 2025年第5期90-97,共8页
针对面部不连续动作单元的关联特征提取困难,以及不同面部区域对表情识别影响程度不一可能引入无用信息的问题,提出了一种基于双分支注意力机制的多尺度自适应空洞卷积模型(dual branching attention mechanism-adaptive multi-scale di... 针对面部不连续动作单元的关联特征提取困难,以及不同面部区域对表情识别影响程度不一可能引入无用信息的问题,提出了一种基于双分支注意力机制的多尺度自适应空洞卷积模型(dual branching attention mechanism-adaptive multi-scale dilated convolution,DAM-ADCNN)。模型通过双分支注意力机制生成特征映射,表征面部动作单元的局部和全局分布及关联关系;利用多尺度空洞卷积提取面部不连续动作单元的关键特征;采用自适应方式动态调整不同尺度关联特征的权重,以有效减少无用信息的干扰。结果表明,DAM-ADCNN模型在情感识别任务中的表现优于现有方法。在DEAP数据集的唤醒和效价维度上,模型的识别准确率分别提升了3.66%和3.99%。同时,在CK+数据集上,模型的识别准确率提高了3.93%。这些结果证明了DAM-ADCNN模型在面部表情情感识别中的有效性。 展开更多
关键词 面部情感识别 双分支注意力机制 空洞卷积 自适应权重
在线阅读 下载PDF
基于注意力机制和多尺度融合的人群计数网络
6
作者 栾方军 龚琪 袁帅 《计算机工程》 北大核心 2025年第3期352-361,共10页
为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),... 为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),将主干网络中不同层次的特征进行跨尺度融合,融合后的特征包含了不同尺度的语义信息,可以更好地适应人群计数任务中的尺度变化问题。接着为了更好地解决人群计数中存在的挑战,设计一个多尺度注意力模块(MSAM),根据不同感受野的分支提取不同尺度的特征,利用选择性Kernel通道注意力(SKCA)缓解多列结构存在的特征相似问题,并将模块生成的注意力图反馈到对应的尺度特征中,以抑制背景的干扰。网络模型在ShanghaiTechA数据集中的平均绝对误差(MAE)和均方根误差(RMSE)分别达到了56.1和93.9;在ShanghaiTechB数据集中的MAE和RMSE分别达到了6.1和10.3;在UCF_CC_50数据集中的MAE和RMSE分别达到了174.9和252.7;在Mall数据集中的MAE和RMSE分别达到了1.42和1.85。在公开数据集上的实验结果表明,提出的网络模型与现有代表性的人群计数方法相比,在提升人群计数任务的准确性和鲁棒性方面均取得了明显进展。 展开更多
关键词 人群计数 多尺度特征融合 注意力机制 神经网络 密度图
在线阅读 下载PDF
基于注意力机制和空洞卷积的无人机图像目标检测 被引量:1
7
作者 赖勤波 马正华 朱蓉 《计算机应用与软件》 北大核心 2025年第2期227-235,共9页
针对现有无人机图像目标检测算法存在小目标检测精度低、多尺度目标漏检等问题,提出一种基于通道注意力机制和并行结构空洞卷积特征融合的无人机图像目标检测算法。该算法在ResNet50特征提取网络中引入SENet和PSDCFFN,从通道和感受野两... 针对现有无人机图像目标检测算法存在小目标检测精度低、多尺度目标漏检等问题,提出一种基于通道注意力机制和并行结构空洞卷积特征融合的无人机图像目标检测算法。该算法在ResNet50特征提取网络中引入SENet和PSDCFFN,从通道和感受野两个层面提高算法的特征表达能力,并使用ROI Align代替ROI Pooling,基于K-Means重新设计RPN(Region Proposal Networks)锚框尺寸,减小目标回归过程的坐标偏差。实验表明,该算法能够提升无人机图像目标检测精度,在RSOD-Dataset和无人机图像数据集上,mAP分别达到92.52%和98.07%。 展开更多
关键词 无人机图像 FASTER R-CNN 注意力机制 空洞卷积 特征融合 目标检测
在线阅读 下载PDF
多尺度融合与注意力机制的生丝条干与疵点提取算法 被引量:1
8
作者 胡涛涛 孙卫红 +1 位作者 梁曼 邵铁锋 《中国测试》 北大核心 2025年第5期148-154,161,共8页
动态采集生丝图像时生丝微小抖动会造成生丝图像模糊,为解决现有生丝图像分割算法对模糊生丝条干与边缘疵点分割效果不佳的问题,以U-Net作为主干特征提取网络,提出一种基于多尺度融合与注意力机制的生丝条干与疵点分割算法。首先,将生... 动态采集生丝图像时生丝微小抖动会造成生丝图像模糊,为解决现有生丝图像分割算法对模糊生丝条干与边缘疵点分割效果不佳的问题,以U-Net作为主干特征提取网络,提出一种基于多尺度融合与注意力机制的生丝条干与疵点分割算法。首先,将生丝原始特征图进行空间与通道上的双路注意力抓取,增强网络对丝干与疵点等有效特征的提取能力。其次,通过编码器浅层嵌入的边缘定位模块获取细粒度的生丝边缘细节信息,将其输入到解码器特征融合模块进行不同网络层级的多尺度特征融合。最后,引入Lovsz-Softmax损失函数进行数据均衡,生成分割概率图后得到分割图像。实验结果表明,与现有生丝分割算法相比,该算法对模糊生丝条干有明显的分割优势,且生丝边缘疵点的分割准确率、特异性、敏感度分别达到98.26%,99.54%,84.31%;相比于原始U-Net网络,各指标分别提升2.59%,1.35%,5.87%。 展开更多
关键词 生丝 模糊条干 边缘疵点 注意力机制 多尺度融合 语义分割
在线阅读 下载PDF
基于双重注意力机制的多尺度指代目标分割方法
9
作者 胡梦楠 王蓉 +1 位作者 张文靖 张琪 《计算机辅助设计与图形学学报》 北大核心 2025年第1期148-156,共9页
针对指代分割任务中视觉和语言间缺乏充分的跨模态交互、不同尺寸的目标空间和语义信息存在差异的问题,提出了基于双重注意力机制的多尺度指代目标分割方法.首先,利用语言表达中不同类型的信息关键词来增强视觉和语言特征的跨模态对齐,... 针对指代分割任务中视觉和语言间缺乏充分的跨模态交互、不同尺寸的目标空间和语义信息存在差异的问题,提出了基于双重注意力机制的多尺度指代目标分割方法.首先,利用语言表达中不同类型的信息关键词来增强视觉和语言特征的跨模态对齐,并使用双重注意力机制捕捉多模态特征间的依赖性,实现模态间和模态内的交互;其次,利用语言特征作为引导,从其他层次的特征中聚合与目标相关的视觉信息,进一步增强特征表示;然后利用双向ConvLSTM以自下而上和自上而下的方式逐步整合低层次的空间细节和高层次的语义信息;最后,利用不同膨胀因子的空洞卷积融合多尺度信息,增加模型对不同尺度分割目标的感知能力.此外,在UNC,UNC+,GRef和ReferIt基准数据集上进行实验,实验结果表明,文中方法在UNC,UNC+,GRef和ReferIt上的oIoU指标分别提高了1.81个百分点、1.26个百分点、0.84个百分点和0.32个百分点,广泛的消融研究也验证了所提方法中各组成部分的有效性. 展开更多
关键词 指代目标分割 跨模态交互 特征增强 注意力机制 多尺度融合
在线阅读 下载PDF
自注意力机制下多尺度特征融合的轴承故障诊断
10
作者 史浩进 邱吉尔 +2 位作者 陶洪峰 唐金琳 靳广虎 《控制工程》 北大核心 2025年第9期1603-1610,共8页
针对多层次、非线性和非平稳的滚动轴承振动信号会导致轴承跨工况故障诊断困难的问题,提出了一种自注意力机制下多尺度特征融合的故障诊断模型。首先,通过不同尺度的卷积核分别提取轴承原始振动信号的低频特征与局部时域特征;其次,构建... 针对多层次、非线性和非平稳的滚动轴承振动信号会导致轴承跨工况故障诊断困难的问题,提出了一种自注意力机制下多尺度特征融合的故障诊断模型。首先,通过不同尺度的卷积核分别提取轴承原始振动信号的低频特征与局部时域特征;其次,构建嵌入多头自注意力(multi-headed self attention,MHSA)模块和压缩激励自注意力(squeezeand-excitation,SE)模块的多尺度特征融合模块MHSA-SE代替传统的拼接方法,进一步挖掘振动信号时频特征的内在联系,以提高跨工况诊断的性能。同时,采用批量归一化处理,以减少内部变量偏移,改善训练性能。实验结果表明,该端到端故障诊断方法能充分联合不同尺度特征,使跨工况的平均诊断精度达到97%以上。 展开更多
关键词 滚动轴承 故障诊断 卷积神经网络 多尺度特征融合 注意力机制
在线阅读 下载PDF
结合注意力机制和多尺度特征融合的三维手部姿态估计
11
作者 郭诗月 党建武 +1 位作者 王阳萍 雍玖 《计算机应用》 北大核心 2025年第4期1293-1299,共7页
针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(S... 针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(SEM),以替换沙漏网络(HGNet)中的基本块(Basicblock),在扩大感受野的同时增强对空间信息的敏感性,从而提高手部特征的提取能力;其次,设计一种结合SPCNet(Spatial Preserve and Contentaware Network)和Soft-Attention改进的多尺度信息融合模块SS-MIFM(SPCNet and Soft-attention-Multi-scale Information Fusion Module),在充分考虑空间内容感知机制的情况下,有效地聚合多级特征,并显著提高二维手部关键点检测的准确性;最后,利用2.5D姿态转换模块将二维姿态转换为三维姿态,从而避免二维关键点坐标直接回归计算三维姿态信息导致的空间丢失问题。实验结果表明,在InterHand2.6M数据集上,所提算法的双手关节点平均误差(MPJPE)、单手MPJPE和根节点平均误差(MRRPE)分别达到了12.32、9.96和29.57 mm;在RHD(Rendered Hand pose Dataset)上,与InterNet和QMGR-Net算法相比,所提算法的终点误差(EPE)分别降低了2.68和0.38 mm。以上结果说明了所提算法能够更准确地估计手部姿态,且在一些双手交互和遮挡的场景下有更高的鲁棒性。 展开更多
关键词 手部姿态估计 多尺度特征融合 注意力机制 高分辨率网络 沙漏网络
在线阅读 下载PDF
基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断
12
作者 章力 邓艾东 +2 位作者 王敏 卞文彬 张宇剑 《动力工程学报》 北大核心 2025年第4期571-581,共11页
针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特... 针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特征信息;同时,构建多尺度减法神经网络模型,关注层级差异;其次,引入轻量化模块,减少内存访问;然后,结合通道注意力机制,调整特征权重;最后,将故障样本输入到网络模型中,实现精确分类。利用风电机组传动系统模拟实验台采集的样本数据进行诊断任务。结果表明:该故障诊断模型能够有效克服传统多尺度卷积神经网络模型网络层数多、参数量大所带来的弊端,能够充分关注各层级之间的差异信息,减少冗余信息的提取,精确定位故障特征,缩短模型训练时间,在恒定工况、变工况和强噪声工况下都具有较高的诊断精度. 展开更多
关键词 滚动轴承 故障诊断 多尺度减法神经网络 轻量化模块 通道注意力机制 变工况
在线阅读 下载PDF
基于多尺度CNN与双阶段注意力机制的轴承工况域泛化故障诊断 被引量:5
13
作者 乔卉卉 赵二贤 +3 位作者 郝如江 刘婕 刘帅 王勇超 《振动与冲击》 北大核心 2025年第2期267-278,共12页
变工况条件下,基于深度学习的列车轮对轴承故障诊断模型的训练集与测试集通常来自不同的工况,不同工况振动信号数据分布差异引起的领域漂移问题导致模型准确率降低。基于域适应的变工况轴承故障诊断方法需要获取目标工况域的样本数据参... 变工况条件下,基于深度学习的列车轮对轴承故障诊断模型的训练集与测试集通常来自不同的工况,不同工况振动信号数据分布差异引起的领域漂移问题导致模型准确率降低。基于域适应的变工况轴承故障诊断方法需要获取目标工况域的样本数据参与训练,这在工程实际中难以实现,因此无法实现未知工况的轴承故障诊断。针对以上问题,提出了一种基于多尺度卷积神经网络与双阶段注意力机制网络(two-stage attention multiscale convolutional network model, TSAMCNN)模型的轴承工况域泛化故障诊断方法,其中多尺度特征提取模块从多个尺度上提取时域振动信号中更丰富的故障信息;然后,双阶段注意力模块从通道和空间两个维度自适应地增强故障敏感特征并抑制工况敏感特征和无用特征;最终,提取工况域不变故障特征,从而实现工况域泛化轴承故障诊断。通过变转速和变负载列车轮对轴承故障诊断试验,证明了TSAMCNN模型可提高变工况条件下轴承故障诊断的准确率、抗噪性能和工况域泛化能力。此外,对双阶段注意力机制的权重向量和模型各模块提取的特征进行可视化分析,提高了模型可解释性。 展开更多
关键词 列车轮对轴承 工况域泛化故障诊断 卷积神经网络(CNN) 多尺度特征提取 注意力机制
在线阅读 下载PDF
基于多尺度注意力机制的无人机小目标检测算法 被引量:1
14
作者 冯迎宾 郭枭尊 晏佳华 《兵工学报》 北大核心 2025年第1期12-21,共10页
针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster ... 针对无人机航拍图像密集度大、目标尺寸小、背景复杂等难点,提出一种基于多尺度注意力机制的小目标检测(Small target detection of BPAN-EF_C2f YOLOv8s,SBE_YOLOv8s)算法,通过设计一种基于多尺度注意力机制的特征提取模块(EMA-Faster Block_C2f,EF_C2f),替换YOLOv8网络中的C2f模块,提高网络对小目标特征的提取能力;在特征融合网络中增加P1检测层,并设计一种跨尺度特征融合结构(Bi-Path Aggregation Network,BPAN),融合小目标特征信息;增加一个微小目标检测头,使用SIoU Loss作为边界框损失函数,提升小目标检测精度和网络收敛速度。在公开数据集VisDrone2019上进行实验验证。验证结果表明:与YOLOv8s算法相比,新算法在检测精度上提升了6.9%、mAP50提升了9.1%,模型参数量减少了44.6%,检测速度为28帧/s,新算法在小目标检测领域具有一定的实用性。 展开更多
关键词 多尺度注意力机制 YOLOv8s算法 特征提取 尺度特征融合 小目标检测
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的视频异常检测方法
15
作者 吴祥 肖剑 吉根林 《应用科学学报》 北大核心 2025年第2期234-244,共11页
视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限... 视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限制了其异常检测的性能。针对该问题,本文基于生成对抗网络结构,提出了一种基于多尺度特征融合和注意力机制的视频异常检测方法。使用大小不同的卷积核捕获不同感受野的特征,并将它们进行融合以获得多尺度的特征表示。此外,在生成器的转置卷积层后引入坐标注意力机制,自适应分配特征图权重,从而增强模型对关键特征的感知能力。在公开数据集UCSD Ped2和Avenue上的实验结果表明,本文方法的性能优于其他同类方法。 展开更多
关键词 视频异常检测 深度学习 生成对抗网络 多尺度特征融合 注意力机制
在线阅读 下载PDF
面向分割的局部分块与全局多尺度注意力机制
16
作者 谭荆彬 赵旭俊 苏慧娟 《计算机工程与设计》 北大核心 2025年第4期1141-1148,共8页
现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个... 现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个小块,分别计算这些小块的注意力得分,增强对局部信息的感知能力。使用一组空洞卷积计算整个特征图的得分,获得全局多尺度信息的权衡。实验中,将PGMA集成到U-Net、DeepLab、SegNet等语义分割网络中,有效提升了它们的分割性能。这表明PGMA在增强CNN性能方面优于当前主流方法。 展开更多
关键词 卷积神经网络 注意力机制 局部信息 分块策略 细节感知 全局多尺度信息 语义分割
在线阅读 下载PDF
CA-MFE:CNN与注意力机制多尺度的图神经小样本图像分类网络 被引量:1
17
作者 刘拥民 肖凤姣 +2 位作者 乔梦媛 邓伟豪 麻海志 《控制工程》 北大核心 2025年第6期1008-1015,共8页
由于将一般图神经网络特征提取模块设计成固定的卷积神经网络(convolutional neural network,CNN)会导致在捕获全局特征信息时,存在接受域受限且容易忽视图像的关键性特征信息等问题。因此,为了提取全面且关键的特征信息,提出了全新的CA... 由于将一般图神经网络特征提取模块设计成固定的卷积神经网络(convolutional neural network,CNN)会导致在捕获全局特征信息时,存在接受域受限且容易忽视图像的关键性特征信息等问题。因此,为了提取全面且关键的特征信息,提出了全新的CA-MFE算法。首先,利用CNN中的不同卷积核来获取多尺度的局部特征信息,再根据注意力机制的全局特征提取能力,将通道和空间注意力机制进行并行处理,以此来提取多维度的全局特征信息。在mini-ImageNet和tiered-Image Net数据集上对所提模型的性能进行了全面的综合评估。相较于基准模型,所提模型在mini-ImageNet和tiered-ImageNet这2个数据集上的分类准确率分别提升了1.07%和1.33%;在5-way 5-shot任务中使用mini-ImageNet数据集,相较于图神经网络、时间Petri网(time Petri net,TPN)和动态图神经网络(dynamic graph neural network,DGNN),所提模型的分类准确率分别提升了11.41%、7.42%和5.38%。实验结果表明,相较于基准模型和几种有代表性的小样本分类算法模型,全新的CA-MFE模型在处理小样本分类数据时性能更优越。 展开更多
关键词 小样本图像分类 图神经网络 卷积神经网络 注意力机制 多尺度特征
在线阅读 下载PDF
AConvLSTM U-Net:基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型
18
作者 李苏强 王周阳 +1 位作者 产思贤 周小龙 《南方医科大学学报》 北大核心 2025年第5期1082-1092,共11页
目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以... 目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以增强特征提取能力。其次,采用双路径稠密卷积(DPD)连接编码器和解码器,在跳跃连接中引入双向ConvLSTM以获取丰富的语义信息。然后,解码路径上使用基于空间和通道注意力的解码块(scSE),以提升对重要信息的关注。最后,设计了全尺寸深度监督模块(DS),并结合联合损失函数对模型进行优化,以进一步提高分割精度。结果AConvLSTM U-Net在颌骨囊肿病灶分割的实验结果在MCC、DSC和JSC方面分别达到93.8443%、93.9067%、88.5133%,性能均优于所有被比较的分割模型。结论所提出的算法在颌骨囊肿数据集上表现出较高的准确性与鲁棒性,优于多种主流方法,展现了AConvLSTM U-Net在颌骨囊肿图像分割的优越性能和辅助诊断的巨大潜力。 展开更多
关键词 注意力机制 多尺度颌骨囊肿分割模型 稠密卷积
在线阅读 下载PDF
轻量化的多尺度注意力脊柱侧弯筛查方法 被引量:1
19
作者 郝子强 唐颖 +2 位作者 田芳 张岩 詹伟达 《计算机工程与应用》 北大核心 2025年第3期286-294,共9页
近年来,深度学习越来越多地应用于脊柱侧弯筛查技术研究,并且取得了突出的成效。为了解决脊柱侧弯筛查的精度和效率不高,无法满足大规模脊柱侧弯筛查需要的问题,设计了一种轻量化的多尺度注意力卷积神经网络,对ResNet50进行改进,取得了... 近年来,深度学习越来越多地应用于脊柱侧弯筛查技术研究,并且取得了突出的成效。为了解决脊柱侧弯筛查的精度和效率不高,无法满足大规模脊柱侧弯筛查需要的问题,设计了一种轻量化的多尺度注意力卷积神经网络,对ResNet50进行改进,取得了较好的筛查效果。提出了一种多尺度残差特征提取模块,使用不同大小的卷积核,提取不同尺度的信息;使用三个残差块并在残差块中使用一种混合注意力机制,关注通道和空间两方面的信息,增强特征提取能力;将普通卷积替换成一种深度混洗卷积,在精度损失不多的情况下,提高网络效率;提出了一种多层次特征融合模块,将多个层次信息进行特征融合,提取更加多样化的特征信息。实验证明,相比ResNet50总体准确率提高了11.19个百分点,测试时长减少了2 s。 展开更多
关键词 脊柱侧弯 深度学习 多尺度特征 注意力机制
在线阅读 下载PDF
融合多尺度特征与注意力的小样本目标检测 被引量:1
20
作者 张英俊 甘望阳 +1 位作者 谢斌红 张睿 《小型微型计算机系统》 北大核心 2025年第3期689-696,共8页
针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatia... 针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatial Pyramid Pooling)模块获取不同的感受野,以捕获目标细节信息的多尺度特征.其次,采用Bi-FPN网络进行多尺度特征融合,获得更具代表性的查询特征与支持特征,有效缓解尺度变化问题.然后,利用提出的注意力引导特征增强模块对查询特征与支持特征进行自身关注,使得它们具有更好的判别能力,由此促进查询特征与支持特征的融合,以更好地应对外观变化和遮挡带来的挑战,从而缓解误检、漏检问题.最后,将分类头与边界框回归头进行解耦,分别对RPN网络基于细粒度查询特征产生的候选区域进行目标分类与目标定位.在PASCAL VOC与MS COCO数据集上的实验结果表明,所提模型的检测性能优于主流的小样本目标检测模型,相较于基线模型DCNet,mAP平均分别提升了3.5%与2.1%. 展开更多
关键词 小样本学习 元学习 目标检测 多尺度特征融合 注意力机制
在线阅读 下载PDF
上一页 1 2 44 下一页 到第
使用帮助 返回顶部