期刊文献+
共找到607篇文章
< 1 2 31 >
每页显示 20 50 100
结合通道与空间注意力机制的声音事件检测方法
1
作者 冯宇轩 刘玲文 +1 位作者 付海涛 朱丽 《吉林大学学报(理学版)》 北大核心 2025年第4期1143-1149,共7页
针对样本稀缺条件下声学特征提取不充分的问题,提出一种基于通道和空间压缩的小样本声音事件检测方法.该方法通过构建双压缩注意力机制,在通道维度进行特征筛选,在空间维度实现特征聚焦,有效提升了原型网络在小样本场景下的特征判别能力... 针对样本稀缺条件下声学特征提取不充分的问题,提出一种基于通道和空间压缩的小样本声音事件检测方法.该方法通过构建双压缩注意力机制,在通道维度进行特征筛选,在空间维度实现特征聚焦,有效提升了原型网络在小样本场景下的特征判别能力.实验结果表明,该方法在数据集DCASE(detection and classification of acoustic scenes and events)上的F1达66.84%,相比原型网络方法提升4.11个百分点,为野生动物监测和生态环境评估等实际应用提供了更可靠的技术支持. 展开更多
关键词 声音事件检测 原型网络 通道注意力 空间注意力
在线阅读 下载PDF
基于通道注意力机制增强DGNN的外骨骼机器人步态相位预测 被引量:1
2
作者 颜建军 许赢家 +2 位作者 林越 金理 江金林 《华东理工大学学报(自然科学版)》 北大核心 2025年第1期110-118,共9页
利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,... 利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,采集人体下肢的行走步态数据并构建人体下肢的骨架模型;之后,建立了基于CA-DGNN步态相位的预测模型,提取人体步态相位的运动特征,并基于当前时刻数据预测未来时刻的步态相位;最后,探讨了滑动窗口大小对算法性能的影响。本文提高了外骨骼机器人步态相位预测的准确性和鲁棒性,为此方向研究提供了一种新的思路和方法。 展开更多
关键词 步态相位预测 惯性传感器 骨架 时空图卷积网络 通道注意力机制
在线阅读 下载PDF
应用归一化通道注意力机制的YOLOv7交通标志检测算法
3
作者 刘晶 刘俊伟 《计算机工程与应用》 北大核心 2025年第11期249-258,共10页
现有目标检测算法对背景复杂下小交通标志的检测效果并不理想。为此,提出了一种基于归一化通道注意力机制YOLOv7的交通标志检测算法(YOLOv7 based on normalized channel attention mechanism,YOLOv7-NCAM)。为了使YOLOv7-NCAM模型具有... 现有目标检测算法对背景复杂下小交通标志的检测效果并不理想。为此,提出了一种基于归一化通道注意力机制YOLOv7的交通标志检测算法(YOLOv7 based on normalized channel attention mechanism,YOLOv7-NCAM)。为了使YOLOv7-NCAM模型具有像素级建模能力,提高它对小目标交通标志特征的提取能力,YOLOv7-NCAM算法使用FReLU激活函数构建了DBF和CBF两种卷积层,并用它们来组建模型的Backbone模块和Neck模块;提出一种归一化通道注意力机制(normalized channel attention mechanism,NCAM)并加入Head模块中。通过与整体网络一起训练,得到归一化(batch normalization,BN)缩放因子,利用缩放因子算出各个通道的权重因子,提升网络对交通标志特征的表达能力,从而使YOLOv7-NCAM网络模型能够集中关注检测目标交通标志。通过在CCTSDB-2021交通标志检测数据集上的测试,与YOLOv7网络模型对比结果表明,YOLOv7-NCAM算法对背景复杂下小交通标志的检测各项指标均有明显提高:准确率(precision,P)达到91.5%,比原网络高出9.5个百分点;召回率(recall,R)达到85.9%,比原网络高出5.7个百分点;均值平均精度(mean average precision,mAP)达到了91.4%,比原网络高出4.7个百分点。与现有的交通标志检测算法相比,YOLOv7-NCAM算法的检测准确率也有提高,且检测速度48.3 FPS,能满足实时需求。 展开更多
关键词 YOLOv7 归一化通道注意力机制 交通标志 激活函数
在线阅读 下载PDF
融合多通道语义信息与注意力机制的Web服务类别标签推荐
4
作者 彭菲 潘国庆 +1 位作者 任志考 胡强 《计算机集成制造系统》 北大核心 2025年第6期2215-2225,共11页
服务表征向量的质量是影响Web服务类别标签推荐准确率的关键因素,针对现有方法在生成服务表征向量时普遍存在语义表达不完备和精确度不高,从而影响服务类别标签的推荐准确性的问题,提出一种融合多通道语义信息与注意力机制的Web服务类... 服务表征向量的质量是影响Web服务类别标签推荐准确率的关键因素,针对现有方法在生成服务表征向量时普遍存在语义表达不完备和精确度不高,从而影响服务类别标签的推荐准确性的问题,提出一种融合多通道语义信息与注意力机制的Web服务类别标签推荐方法。利用RoBERTa模型生成服务描述文本中特征词的嵌入表示,建立面向不同粒度特征词的语义信息提取通道;构建一种带有快速规则近似注意力机制的全局语义提取模型FRASRU,实现特征词自身语义特征与全局语义特征的快速融合;将多通道特征融合的服务表征向量输入预训练好的sigmiod分类器,实现类别标签推荐。实验表明所提方法优于同类对比模型与分类方法,具有良好的分类效果。 展开更多
关键词 标签推荐 通道 注意力机制 WEB服务
在线阅读 下载PDF
基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断
5
作者 章力 邓艾东 +2 位作者 王敏 卞文彬 张宇剑 《动力工程学报》 北大核心 2025年第4期571-581,共11页
针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特... 针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特征信息;同时,构建多尺度减法神经网络模型,关注层级差异;其次,引入轻量化模块,减少内存访问;然后,结合通道注意力机制,调整特征权重;最后,将故障样本输入到网络模型中,实现精确分类。利用风电机组传动系统模拟实验台采集的样本数据进行诊断任务。结果表明:该故障诊断模型能够有效克服传统多尺度卷积神经网络模型网络层数多、参数量大所带来的弊端,能够充分关注各层级之间的差异信息,减少冗余信息的提取,精确定位故障特征,缩短模型训练时间,在恒定工况、变工况和强噪声工况下都具有较高的诊断精度. 展开更多
关键词 滚动轴承 故障诊断 多尺度减法神经网络 轻量化模块 通道注意力机制 变工况
在线阅读 下载PDF
基于多重注意力机制和空间变换网络的换衣行人重识别
6
作者 李鹏辉 王洪元 +1 位作者 张继 陈海琴 《南京大学学报(自然科学版)》 北大核心 2025年第2期202-213,共12页
换衣行人重识别(Cloth-Changing Person Re-Identification,CC Re-ID)技术旨在监控视频或图像中针对同一行人在长时间跨度中进行识别,现有方法主要利用多模态信息来建模体型以减轻服装的影响,但其泛化能力差且需大量额外工作,而且,仅利... 换衣行人重识别(Cloth-Changing Person Re-Identification,CC Re-ID)技术旨在监控视频或图像中针对同一行人在长时间跨度中进行识别,现有方法主要利用多模态信息来建模体型以减轻服装的影响,但其泛化能力差且需大量额外工作,而且,仅利用RGB图像的方法无法充分提取与服装无关的信息.针对以上问题,提出一种基于多重注意力机制和空间变换网络的换衣行人重识别方法,通过在主干网络中融入CBAM(Convolutional Block Attention Module)和STN(Spatial Transformer Network,STN)模块,分别提升网络对于不同通道和空间位置重要性的感知能力以及对于不同角度图像的适应能力.为了进一步提高网络对行人细粒度特征的提取能力,融入三重注意力机制来关注不同维度上的信息,引入一个自适应特征提取模块来学习特征中不同区域的重要性.此外,还采用服装分类损失和服装对抗损失等多种损失函数来引导模型学习与服装无关的信息.在四个换衣行人重识别数据集(LTCC,PRCC,VC-Clothes和DeepChange)上进行了大量实验,实验结果表明,提出的方法的Rank-1和mAP指标优于一些先进的换衣行人重识别方法. 展开更多
关键词 换衣行人重识别 基于服装的对抗性损失 三重注意力机制 空间变换网络 自适应特征提取
在线阅读 下载PDF
基于图像恢复和空间通道注意力的下采样图像取证网络
7
作者 刘澳龄 单武扬 +2 位作者 邱骏颖 田茂 李军 《计算机应用》 北大核心 2025年第5期1582-1588,共7页
下采样操作会使图像丢失高频取证痕迹和细节信息,增加图像取证的难度,而现有的基于深度学习的图像取证网络不能有效检测经过下采样操作篡改的图像,导致提高下采样图像取证方法的鲁棒性成为图像取证的瓶颈。为解决这个问题,提出一个下采... 下采样操作会使图像丢失高频取证痕迹和细节信息,增加图像取证的难度,而现有的基于深度学习的图像取证网络不能有效检测经过下采样操作篡改的图像,导致提高下采样图像取证方法的鲁棒性成为图像取证的瓶颈。为解决这个问题,提出一个下采样图像取证网络HirrNet(Hierarchical RRU-Net)。HirrNet主要包括图像恢复模块和篡改检测模块:图像恢复模块使用分层条件流(HCF)的思想,通过恢复篡改图像取证痕迹和细节信息减少高频信息的丢失,从而提高篡改检测性能;篡改检测模块则使用端到端图像分割网络RRU-Net(Ringed Residual U-Net)进行篡改检测。此外,通过结合空间和通道压缩与激励(SCSE)机制,可有效增强下采样图像中与篡改相关的特征的提取。实验结果表明,HirrNet在DSO、Columbia、CASIA和NIST16数据集上的受试者特征工作曲线下面积(AUC)、F1分数和交并比(IoU)优于对比网络。其中,在CASIA数据集上,对于尺寸缩小至原图1/2和1/4的篡改图像,HirrNet的AUC指标相较于对比方法平均提升25和30个百分点。可见,HirrNet可以有效解决现有的下采样图像取证方法鲁棒性差的问题。 展开更多
关键词 图像取证 图像恢复 空间通道注意力 下采样
在线阅读 下载PDF
基于分组卷积的通道重洗注意力机制 被引量:1
8
作者 张李伟 梁泉 +1 位作者 胡禹涛 朱乔乐 《计算机应用》 北大核心 2025年第4期1069-1076,共8页
注意力机制的引入使得主干网能够学习更具区分性的特征表示。然而,为了控制注意力的复杂度,传统的注意力机制采用的通道降维或减少通道数而增加批量大小的策略会导致过度减少通道数和损失重要特征信息的问题。为解决这一问题,提出通道... 注意力机制的引入使得主干网能够学习更具区分性的特征表示。然而,为了控制注意力的复杂度,传统的注意力机制采用的通道降维或减少通道数而增加批量大小的策略会导致过度减少通道数和损失重要特征信息的问题。为解决这一问题,提出通道重洗注意力(CSA)模块。首先,利用分组卷积学习注意力权重,以控制CSA的复杂度;其次,通过传统通道重洗和深层通道重洗(DCS)方法,增强不同组间的通道特征信息交流;再次,使用逆通道重洗恢复注意力权重的顺序;最后,将恢复后的注意力权重与原始特征图相乘,以获得更具表达能力的特征图。实验结果表明,在CIFAR-100数据集上,与添加CA(Coordinate Attention)的ResNet50相比,添加CSA的ResNet50的参数量降低了2.3%,Top-1准确率提升了0.57个百分点;与添加EMA(Efficient Multi-scale Attention)的ResNet50相比,添加CSA的ResNet50的计算量降低了18.4%,Top-1准确率提升了0.27个百分点。在COCO2017数据集上,添加CSA的YOLOv5s比添加CA和EMA的YOLOv5s在平均精度均值(mAP@50)上分别提升了0.5和0.2个百分点。可见,CSA达到了参数量和计算量的平衡,并能够同时提升图像分类任务的准确率和目标检测任务的定位能力。 展开更多
关键词 注意力机制 分组卷积 通道重洗 图像分类 目标检测
在线阅读 下载PDF
基于通道注意力机制的MIMO神经网络均衡算法
9
作者 户俊杰 延凤平 +2 位作者 郭浩 王鹏飞 骆长亮 《光通信技术》 北大核心 2025年第3期22-26,共5页
针对模分复用光传输系统中的模式串扰问题,提出了一种基于通道注意力机制的多输入多输出(MIMO)神经网络均衡算法(MIMO-NNE-CAM)算法。该算法通过引入通道注意力机制,使神经网络专注于更重要的信道特征,实现信号的有效均衡。为验证算法性... 针对模分复用光传输系统中的模式串扰问题,提出了一种基于通道注意力机制的多输入多输出(MIMO)神经网络均衡算法(MIMO-NNE-CAM)算法。该算法通过引入通道注意力机制,使神经网络专注于更重要的信道特征,实现信号的有效均衡。为验证算法性能,利用VPI Transmission仿真平台搭建了三模模分复用系统进行测试。实验结果表明:在满足误码率为1×10^(-3)的条件下,MIMO-NNE-CAM算法相较原始MIMO-NNE算法和最小均方(LMS)算法分别具有1.3dB和3.1dB的性能增益,且在强耦合情况下也能保持稳定的误码性能,展现出更快的收敛速度和更强的抗耦合能力。 展开更多
关键词 信道均衡 模分复用 神经网络 模间串扰 通道注意力机制
在线阅读 下载PDF
融合空间与通道重构卷积和注意力的轻量型动物姿态估计
10
作者 宰清鹏 徐杨 《计算机工程与应用》 北大核心 2025年第6期282-294,共13页
动物姿态估计在行为生态学、动物健康监测、野生动物保护等领域的重要性不断凸显。然而,目前主流的动物姿态估计算法过于关注准确率,导致网络复杂度和计算成本不断攀升,这使得在移动设备和嵌入式平台上的应用受到了限制。针对该问题,提... 动物姿态估计在行为生态学、动物健康监测、野生动物保护等领域的重要性不断凸显。然而,目前主流的动物姿态估计算法过于关注准确率,导致网络复杂度和计算成本不断攀升,这使得在移动设备和嵌入式平台上的应用受到了限制。针对该问题,提出融合空间与通道重构卷积和金字塔分割注意力的多尺度动物姿态估计网络SPANet。使用金字塔分割注意力与坐标注意力机制,重新设计了高分辨率网络的瓶颈层EPSAneck,在减轻过度使用大卷积核带来的计算成本的同时,增强了网络对有用特征的提取能力;提出了基于空间和通道重构卷积以及坐标注意力机制的SCCAblock基础模块,在显著减少计算冗余和内存访问的同时,增强了通道与空间之间的信息交互;利用反卷积模块对网络输出的特征融合方式进行重新设计,进一步提升了网络的准确率。实验结果表明,提出的网络模型相较于高分辨率网络在AP10K测试集上的平均精度提升了1.8个百分点,同时浮点运算量降低了48.5%、模型参数量减少了67.0%。在AnimalPose数据集上,浮点运算量降低49.5%,模型参数量降低67.0%。实验数据表明,该网络可在降低模型复杂度的同时实现预测精度的小范围提升。 展开更多
关键词 动物姿态估计 轻量型 高分辨率 注意力机制 空间通道重构卷积
在线阅读 下载PDF
多尺度通道注意力机制空调启停时间预测研究
11
作者 王华秋 谭佳豪 《重庆理工大学学报(自然科学)》 北大核心 2025年第3期66-74,共9页
为了降低生产车间的空调能耗,构建了一种基于数据分解的通道注意力机制空调启停时间预测模型FDCANet。该模型将输入数据分解为周期性特征与趋势性特征。通过改进通道注意力机制对细节特征进行更深层次的学习,通过特征融合的方式融合内... 为了降低生产车间的空调能耗,构建了一种基于数据分解的通道注意力机制空调启停时间预测模型FDCANet。该模型将输入数据分解为周期性特征与趋势性特征。通过改进通道注意力机制对细节特征进行更深层次的学习,通过特征融合的方式融合内部特征得到预测结果。结果表明:该方法较多个预测模型在多个评价指标上都有更小的误差准确率,MSE、MAE和MAPE平均降低16.67%、5.29%、20.15%,展现出较好的优势,从而更好地预测车间内空调启停时间。使用预测结果后,车间的能耗明显降低,为节能优化提供了有力支撑。 展开更多
关键词 空调启停时间 数据分解 通道注意力机制 预测模型 节能优化
在线阅读 下载PDF
采用空间和通道激励注意力机制优化ResNet-50的CFRP/TC4叠层材料钻削刀具磨损状态监测 被引量:1
12
作者 聂鹏 杨程越 +2 位作者 彭新月 于家鹤 潘五九 《中国机械工程》 EI CAS CSCD 北大核心 2024年第10期1793-1801,共9页
针对碳纤维增强复合材料(CFRP)与钛合金组成的叠层材料在制备装配孔时存在刀具磨损严重的问题,提出了一种空间和通道激励注意力机制(scSE)优化深度残差神经网络(ResNet-50)的刀具磨损监测方法。开展钻削实验,采集钻削过程中的力和温度信... 针对碳纤维增强复合材料(CFRP)与钛合金组成的叠层材料在制备装配孔时存在刀具磨损严重的问题,提出了一种空间和通道激励注意力机制(scSE)优化深度残差神经网络(ResNet-50)的刀具磨损监测方法。开展钻削实验,采集钻削过程中的力和温度信号,信号经连续小波变换转换为小波尺度谱。搭建ResNet-50网络结构,从空间和通道双维度对卷积提取的特征图进行权重标定。研究结果表明,scSE可以从空间和通道两个维度做到增强有用特征,抑制无用特征,经scSE优化的网络结构识别准确度达到96.15%。 展开更多
关键词 刀具磨损 连续小波变换 空间通道激励注意力机制 深度残差神经网络
在线阅读 下载PDF
融合邻域注意力和状态空间模型的医学视频分割算法
13
作者 丁建睿 张听 +1 位作者 刘家栋 宁春平 《电子与信息学报》 北大核心 2025年第5期1582-1595,共14页
在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过... 在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过两阶段的精心设计,显著提升了分割性能:第1阶段,通过深度卷积网络捕获低层次的空间语义信息,并借助邻域注意力机制,挖掘相邻帧间的局部时序语义关联。第2阶段,引入状态空间模型来捕捉全面的时序信息,并再次应用邻域注意力模块,进一步增强对局部时序特征的敏感度。该方法不仅有效整合了视频中丰富的时序信息,而且在局部和全局层面上实现了空间与时间特征的协同优化。相较于使用具有2次计算复杂度的自注意力机制,该文采用了具有线性计算复杂度的状态空间模型,显著提升了模型的训练效率和推理速度。所提算法在甲状腺超声视频数据集以及结肠息肉视频数据集CVC-ClinicDB和CVC-ColonDB上的交并比(IOU)指标分别达到了72.7%,82.3%和72.5%,相比该文的基线模型Vivim分别提高了5.7%,1.7%和5.5%。此外,消融实验进一步揭示了邻域注意力模块和状态空间模型在提取时序信息中发挥的关键作用。 展开更多
关键词 医学视频分割 邻域注意力机制 状态空间模型
在线阅读 下载PDF
结合倒残差自注意力机制的遥感图像目标检测
14
作者 赵文清 赵振寰 巩佳潇 《智能系统学报》 北大核心 2025年第1期64-72,共9页
针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,... 针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,构造多尺度空间金字塔池化模块,提供多尺度感受野,增强捕捉不同尺寸目标的能力;最后,提出轻量级特征融合模块,对骨干网络提取的特征图进行融合,充分结合低层与高层特征,提高网络对不同尺寸目标的检测能力。与传统网络及其他改进目标检测算法进行对比,实验发现该方法的检测精度明显优于其他算法。此外,在DIOR数据集和RSOD数据集上设计消融实验,结果表明,该方法在DIOR数据集与RSOD数据集上的平均精度均值比YOLOv8算法分别提升4.6和4.2百分点,明显提升遥感图像目标检测的精度。 展开更多
关键词 遥感图像 目标检测 倒残差 注意力机制 多尺度 空间金字塔 特征提取 特征融合
在线阅读 下载PDF
基于端口注意力与通道空间注意力的网络异常流量检测 被引量:8
15
作者 肖斌 甘昀 +2 位作者 汪敏 张兴鹏 王照星 《计算机应用》 CSCD 北大核心 2024年第4期1027-1034,共8页
网络异常流量检测是网络安全保护重要组成部分之一。目前,基于深度学习的异常流量检测方法都是将端口号属性与其他流量属性同等对待,忽略了端口号的重要性。为了提高异常流量检测性能,借鉴注意力思想,提出一个卷积神经网络(CNN)结合端... 网络异常流量检测是网络安全保护重要组成部分之一。目前,基于深度学习的异常流量检测方法都是将端口号属性与其他流量属性同等对待,忽略了端口号的重要性。为了提高异常流量检测性能,借鉴注意力思想,提出一个卷积神经网络(CNN)结合端口注意力模块(PAM)和通道空间注意力模块(CBAM)的网络异常流量检测模型。首先,将原始网络流量作为PAM的输入,分离得到端口号属性送入全连接层,得到学习后的端口注意力权重值,并与其他流量属性点乘,输出端口注意力后的流量数据;其次,将流量数据转换成灰度图,利用CNN和CBAM更充分地提取特征图在通道和空间上的信息;最后,使用焦点损失函数解决数据不平衡的问题。所提PAM具有参数量少、即插即用和普遍适用的优点。在CICIDS2017数据集上,所提模型的异常流量检测二分类任务准确率为99.18%,多分类任务准确率为99.07%,对只有少数训练样本的类别也有较高的识别率。 展开更多
关键词 异常流量检测 注意力机制 数据不平衡 轻量级网络 通道空间注意力模块
在线阅读 下载PDF
基于像素差异度注意力机制的轻量化YOLOv5行人检测算法
16
作者 陈高宇 王晓军 李晓航 《计算机工程与应用》 北大核心 2025年第1期291-299,共9页
针对实时行人检测场景存在遮挡、形态姿势不同的行人目标,YOLOv5模型对于这些目标检测有明显的漏检问题,提出一种像素差异度注意力机制(pixel difference attention,PDA),不同于传统的通道注意力机制用全局均值池化(global average pool... 针对实时行人检测场景存在遮挡、形态姿势不同的行人目标,YOLOv5模型对于这些目标检测有明显的漏检问题,提出一种像素差异度注意力机制(pixel difference attention,PDA),不同于传统的通道注意力机制用全局均值池化(global average pooling,GAP)、全局最大值池化(global max pooling,GMP)来概括整张特征图的信息,全局池化将空间压缩成一个值来表征整个通道,造成了空间信息的流失,PDA将空间信息沿高和宽分别压缩,并将其分别与通道信息联系起来做注意力加权操作,同时提出一种新的通道描述指标表征通道信息,增强空间信息与通道信息的交互,使模型更容易关注到综合了空间和通道维度上的特征图的重要信息,在主干网络末端插入PDA后使模型平均精度(mean average precision,mAP)0.5提升了2.4个百分点,mAP0.5:0.95提升了4.4个百分点;针对实时检测场景的部署和检测速度要求模型拥有较少的参数量和计算量,因此提出了新的轻量化特征提取模块AC3代替原YOLOv5模型中的C3模块,该模块使插入PDA后的改进模型在精度仅仅损失0.2个百分点的情况下,参数量(parameters,Param.)减少了20%左右,浮点运算量(giga floating-point operations,GFLOPs)减少了30%左右。实验结果表明,最终的改进模型比YOLOv5s原模型在VOC行人数据集上mAP0.5提升了2.2个百分点,mAP0.5:0.95提升了3.1个百分点,且参数量减少了20%左右,浮点运算量减少了30%左右,在GTX1050上的检测速度(frames per second,FPS)提升了4。 展开更多
关键词 YOLOv5 行人检测 注意力机制 轻量化模型 通道描述指标
在线阅读 下载PDF
融合双重注意力机制的缅甸语图像文本识别方法
17
作者 王奉孝 毛存礼 +3 位作者 余正涛 高盛祥 黄于欣 刘福浩 《中文信息学报》 北大核心 2025年第1期47-55,共9页
由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出... 由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出一种融合通道和空间注意力机制的视觉关注模块,旨在捕获像素级成对关系和通道依赖关系,降低缅甸语图像中噪声干扰,从而获得语义更完整的特征图。此外,在解码过程中,将基于多头注意力的解码单元组合为解码器,用于将特征序列转化为缅甸语文字。实验结果表明,该方法在自构的缅甸语图像文本识别数据集上相比Transformer识别准确率提高0.5%,达到95.3%。 展开更多
关键词 缅甸语 文本识别 通道和空间注意力 特征增强 文字边缘特征
在线阅读 下载PDF
激光雷达稀疏图像的残差通道注意力机制复原重建方法研究
18
作者 严伟 杨韬 +5 位作者 吴志祥 刘岩 胡淑姬 王春勇 来建成 李振华 《电子测量与仪器学报》 CSCD 北大核心 2024年第12期35-42,共8页
稀疏采样与图像复原相结合不但可以压缩数据容量,而且还可以提高成像速度,对于发展高分辨率激光雷达成像技术具有重要意义。为了改善稀疏采样图像的复原效果,本文设计了一种新的残差通道注意力机制网络块,并将残差通道注意力机制引入到... 稀疏采样与图像复原相结合不但可以压缩数据容量,而且还可以提高成像速度,对于发展高分辨率激光雷达成像技术具有重要意义。为了改善稀疏采样图像的复原效果,本文设计了一种新的残差通道注意力机制网络块,并将残差通道注意力机制引入到基于压缩感知迭代软阈值方法的深度展开网络中,抑制图像复原重建中因缺失高频信息而导致的模糊现象,形成了一种新的激光雷达稀疏采样图像的复原重建方法。该方法结合了传统压缩感知重建方法和神经网络方法的优势,与传统压缩感知重建方法相比,具有更快的重建速度;与现有神经网络方法相比,增强了结构洞察力,改进了重建图像模糊问题。以Middlebury Stereo Data 2006为测试数据集的验证计算表明,本文提出的方法与SDA、ReconNet、TVAL3、D-AMP和IRCNN等方法相比不但具有更好的图像重建质量,而且具有较高的计算效率;当稀疏采样比率为25%时,复原后图像的峰值信噪比要比其他方法高1.6 d B以上,是一种综合性能较理想的激光雷达稀疏图像复原方法。 展开更多
关键词 激光雷达 图像复原 稀疏图像 注意力机制 残差通道
在线阅读 下载PDF
融合ViT和通道注意力的水稻病害识别技术研究 被引量:1
19
作者 涂雪滢 张佳鹏 +1 位作者 钱程 刘世晶 《农业与技术》 2025年第7期69-74,共6页
水稻产量和质量对农业经济、粮食安全、农民收入及生态环境至关重要,而水稻病害是影响其产量和质量的关键因素之一。为提升实际种植场景下的病害识别准确率,本文提出了一种融合Vision Transformer和通道注意力机制的水稻病害识别方法。... 水稻产量和质量对农业经济、粮食安全、农民收入及生态环境至关重要,而水稻病害是影响其产量和质量的关键因素之一。为提升实际种植场景下的病害识别准确率,本文提出了一种融合Vision Transformer和通道注意力机制的水稻病害识别方法。收集田间拍摄的水稻病害图像,并通过翻转、旋转、缩放等数据增强手段丰富样本多样性。针对病斑特征在图像中尺度变化大、形态复杂、局部与全局关联困难的问题,采用Vision Transformer作为基础框架,捕捉局部特征与全局信息,并融入通道注意力机制,提升模型对重要特征的关注度。引入迁移学习策略及学习率调度器,提升在样本不足情况下的识别精度并优化模型收敛速度。实验结果表明,本文方法识别精度达96.93%,相比AlexNet、VGG16、ResNet50及原始Vision Transformer,准确率分别提高4.95%、4.62%、1.91%和1.16%,且收敛速度更快,能够满足水稻病害识别需求,为其提供有效的技术支持。 展开更多
关键词 水稻病害 图像识别 Vision Transformer 通道注意力机制
在线阅读 下载PDF
DR_YOLOv8s++:改进卷积注意力机制和损失函数的SAR影像船舰目标检测网络
20
作者 杨明秋 陈国坤 +1 位作者 董燕 左小清 《遥感信息》 北大核心 2025年第2期159-168,共10页
针对目前SAR影像船舰目标检测方法存在多场景下检测精度不高、漏检、模型泛化能力差的问题,尝试以YOLOv8s网络为基础,提出新的注意力机制D-CBAM,并定义新的损失函数RIoU,以及将最新的可变形卷积DCNv4替换标准卷积,引入融合空间金字塔池... 针对目前SAR影像船舰目标检测方法存在多场景下检测精度不高、漏检、模型泛化能力差的问题,尝试以YOLOv8s网络为基础,提出新的注意力机制D-CBAM,并定义新的损失函数RIoU,以及将最新的可变形卷积DCNv4替换标准卷积,引入融合空间金字塔池化focal modulation networks来提升网络性能,提出的网络命名为DR_YOLOv8s++检测网络。为验证DR_YOLOv8s++网络的有效性和通用性,在SSDD、HRSID数据集上进行实验。结果表明,所提出算法的平均精度均值分别达到98%、97.5%,优于其他经典算法,模型性能提升明显,同其他目标检测算法相比,具有较强的泛化能力。 展开更多
关键词 船舰目标检测 SAR影像 注意力机制 可变形卷积 融合空间金字塔池化 损失函数
在线阅读 下载PDF
上一页 1 2 31 下一页 到第
使用帮助 返回顶部