期刊文献+
共找到203篇文章
< 1 2 11 >
每页显示 20 50 100
基于通道注意力机制增强DGNN的外骨骼机器人步态相位预测 被引量:1
1
作者 颜建军 许赢家 +2 位作者 林越 金理 江金林 《华东理工大学学报(自然科学版)》 北大核心 2025年第1期110-118,共9页
利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,... 利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,采集人体下肢的行走步态数据并构建人体下肢的骨架模型;之后,建立了基于CA-DGNN步态相位的预测模型,提取人体步态相位的运动特征,并基于当前时刻数据预测未来时刻的步态相位;最后,探讨了滑动窗口大小对算法性能的影响。本文提高了外骨骼机器人步态相位预测的准确性和鲁棒性,为此方向研究提供了一种新的思路和方法。 展开更多
关键词 步态相位预测 惯性传感器 骨架 时空图卷积网络 通道注意力机制
在线阅读 下载PDF
应用归一化通道注意力机制的YOLOv7交通标志检测算法
2
作者 刘晶 刘俊伟 《计算机工程与应用》 北大核心 2025年第11期249-258,共10页
现有目标检测算法对背景复杂下小交通标志的检测效果并不理想。为此,提出了一种基于归一化通道注意力机制YOLOv7的交通标志检测算法(YOLOv7 based on normalized channel attention mechanism,YOLOv7-NCAM)。为了使YOLOv7-NCAM模型具有... 现有目标检测算法对背景复杂下小交通标志的检测效果并不理想。为此,提出了一种基于归一化通道注意力机制YOLOv7的交通标志检测算法(YOLOv7 based on normalized channel attention mechanism,YOLOv7-NCAM)。为了使YOLOv7-NCAM模型具有像素级建模能力,提高它对小目标交通标志特征的提取能力,YOLOv7-NCAM算法使用FReLU激活函数构建了DBF和CBF两种卷积层,并用它们来组建模型的Backbone模块和Neck模块;提出一种归一化通道注意力机制(normalized channel attention mechanism,NCAM)并加入Head模块中。通过与整体网络一起训练,得到归一化(batch normalization,BN)缩放因子,利用缩放因子算出各个通道的权重因子,提升网络对交通标志特征的表达能力,从而使YOLOv7-NCAM网络模型能够集中关注检测目标交通标志。通过在CCTSDB-2021交通标志检测数据集上的测试,与YOLOv7网络模型对比结果表明,YOLOv7-NCAM算法对背景复杂下小交通标志的检测各项指标均有明显提高:准确率(precision,P)达到91.5%,比原网络高出9.5个百分点;召回率(recall,R)达到85.9%,比原网络高出5.7个百分点;均值平均精度(mean average precision,mAP)达到了91.4%,比原网络高出4.7个百分点。与现有的交通标志检测算法相比,YOLOv7-NCAM算法的检测准确率也有提高,且检测速度48.3 FPS,能满足实时需求。 展开更多
关键词 YOLOv7 归一化通道注意力机制 交通标志 激活函数
在线阅读 下载PDF
基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断
3
作者 章力 邓艾东 +2 位作者 王敏 卞文彬 张宇剑 《动力工程学报》 北大核心 2025年第4期571-581,共11页
针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特... 针对传统多尺度卷积神经网络模型存在的特征定位不精确、训练时间长、抗噪性能差等问题,提出了一种基于通道注意力机制与多尺度减法轻量化网络的滚动轴承故障诊断模型。首先,将滚动轴承的一维振动信号转换为二维灰度图作为输入,丰富特征信息;同时,构建多尺度减法神经网络模型,关注层级差异;其次,引入轻量化模块,减少内存访问;然后,结合通道注意力机制,调整特征权重;最后,将故障样本输入到网络模型中,实现精确分类。利用风电机组传动系统模拟实验台采集的样本数据进行诊断任务。结果表明:该故障诊断模型能够有效克服传统多尺度卷积神经网络模型网络层数多、参数量大所带来的弊端,能够充分关注各层级之间的差异信息,减少冗余信息的提取,精确定位故障特征,缩短模型训练时间,在恒定工况、变工况和强噪声工况下都具有较高的诊断精度. 展开更多
关键词 滚动轴承 故障诊断 多尺度减法神经网络 轻量化模块 通道注意力机制 变工况
在线阅读 下载PDF
基于通道注意力机制的MIMO神经网络均衡算法
4
作者 户俊杰 延凤平 +2 位作者 郭浩 王鹏飞 骆长亮 《光通信技术》 北大核心 2025年第3期22-26,共5页
针对模分复用光传输系统中的模式串扰问题,提出了一种基于通道注意力机制的多输入多输出(MIMO)神经网络均衡算法(MIMO-NNE-CAM)算法。该算法通过引入通道注意力机制,使神经网络专注于更重要的信道特征,实现信号的有效均衡。为验证算法性... 针对模分复用光传输系统中的模式串扰问题,提出了一种基于通道注意力机制的多输入多输出(MIMO)神经网络均衡算法(MIMO-NNE-CAM)算法。该算法通过引入通道注意力机制,使神经网络专注于更重要的信道特征,实现信号的有效均衡。为验证算法性能,利用VPI Transmission仿真平台搭建了三模模分复用系统进行测试。实验结果表明:在满足误码率为1×10^(-3)的条件下,MIMO-NNE-CAM算法相较原始MIMO-NNE算法和最小均方(LMS)算法分别具有1.3dB和3.1dB的性能增益,且在强耦合情况下也能保持稳定的误码性能,展现出更快的收敛速度和更强的抗耦合能力。 展开更多
关键词 信道均衡 模分复用 神经网络 模间串扰 通道注意力机制
在线阅读 下载PDF
多尺度通道注意力机制空调启停时间预测研究
5
作者 王华秋 谭佳豪 《重庆理工大学学报(自然科学)》 北大核心 2025年第3期66-74,共9页
为了降低生产车间的空调能耗,构建了一种基于数据分解的通道注意力机制空调启停时间预测模型FDCANet。该模型将输入数据分解为周期性特征与趋势性特征。通过改进通道注意力机制对细节特征进行更深层次的学习,通过特征融合的方式融合内... 为了降低生产车间的空调能耗,构建了一种基于数据分解的通道注意力机制空调启停时间预测模型FDCANet。该模型将输入数据分解为周期性特征与趋势性特征。通过改进通道注意力机制对细节特征进行更深层次的学习,通过特征融合的方式融合内部特征得到预测结果。结果表明:该方法较多个预测模型在多个评价指标上都有更小的误差准确率,MSE、MAE和MAPE平均降低16.67%、5.29%、20.15%,展现出较好的优势,从而更好地预测车间内空调启停时间。使用预测结果后,车间的能耗明显降低,为节能优化提供了有力支撑。 展开更多
关键词 空调启停时间 数据分解 通道注意力机制 预测模型 节能优化
在线阅读 下载PDF
基于双通道注意力机制的AE-BIGRU交通流预测模型 被引量:1
6
作者 黄艳国 何烜 杨仁峥 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第5期1774-1782,共9页
交通流预测是智能交通系统的关键。针对目前交通流数据复杂的时空关联性以及自身的不确定性,为准确预测高速公路交通流并缓解交通拥堵问题,提出以自编码器网络(AE)和双向门控循环单元(BIGRU)相结合的深度学习组合预测模型(AE-BIGRU),并... 交通流预测是智能交通系统的关键。针对目前交通流数据复杂的时空关联性以及自身的不确定性,为准确预测高速公路交通流并缓解交通拥堵问题,提出以自编码器网络(AE)和双向门控循环单元(BIGRU)相结合的深度学习组合预测模型(AE-BIGRU),并在此基础上引入双通道注意力机制进行模型训练。将预处理后的数据采用滑动窗口的方式作为参数输入模型,通过AE提取交通流的空间特征,得到输入信息特征的最优抽象表示;利用BIGRU从前向和后向传播中获取信息,充分提取交通流的时间相关特征,更全面地捕捉时间演变规律;最后结合双通道注意力机制,增强预测模型的特征提取能力,最大限度地保留特征信息,提升模型的预测精度,从而得到最终短时流量的预测目标值。为验证模型的适用性,采用多组短时交通流数据进行仿真实验,与其他基准模型对比发现:该交通流预测模型能够有效捕获交通流的动态时空特征,加强关键信息的提取,所预测的流量更加接近真实值,具有良好的泛化能力。其中测试集的均方根误差值下降了约0.061~0.604,平均绝对误差值下降了约0.025~0.512,相关系数值R2提高了约0.007~0.062。研究结果表明,随着预测步长的增加,该实验模型在交通流数据的时间特性上仍能表现出稳定的预测性能,所建的组合预测模型在预测精度和鲁棒性方面表现出更高水平。 展开更多
关键词 智能交通 交通流预测 AE-BIGRU模型 深度学习 通道注意力机制
在线阅读 下载PDF
引入通道注意力机制的SSD目标检测算法 被引量:24
7
作者 张海涛 张梦 《计算机工程》 CAS CSCD 北大核心 2020年第8期264-270,共7页
为提升原始SSD算法的小目标检测精度及鲁棒性,提出一种基于通道注意力机制的SSD目标检测算法。在原始SSD算法的基础上对高层特征图进行全局池化操作,结合通道注意力机制增强高层特征图的语义信息,并利用膨胀卷积结构对低层特征图进行下... 为提升原始SSD算法的小目标检测精度及鲁棒性,提出一种基于通道注意力机制的SSD目标检测算法。在原始SSD算法的基础上对高层特征图进行全局池化操作,结合通道注意力机制增强高层特征图的语义信息,并利用膨胀卷积结构对低层特征图进行下采样扩大其感受野以增加细节与位置信息,再通过级联的方式将低层特征图与高层特征图相融合,从而实现小目标及遮挡目标的有效识别。实验结果表明,与原始SSD算法相比,该算法在PASCAL VOC数据集上的平均精度均值提升了2.2%,具有更高的小目标检测精度和更好的鲁棒性。 展开更多
关键词 SSD算法 全局池化 通道注意力机制 膨胀卷积 PASCAL VOC数据集
在线阅读 下载PDF
DenseNet结合空间通道注意力机制的环境声音分类 被引量:3
8
作者 董绍江 刘伟 《重庆理工大学学报(自然科学)》 北大核心 2023年第11期179-187,共9页
音乐信息识别(MIR)和自动语音识别(ASR)都是以结构化声音为特点的声音识别,环境声音识别在声音识别领域的难度很大。为了充分利用从环境声中提取的Log-Mel谱图的空间特征与通道特征,提出了一种基于密集连接卷积网络(DenseNet)的空间通... 音乐信息识别(MIR)和自动语音识别(ASR)都是以结构化声音为特点的声音识别,环境声音识别在声音识别领域的难度很大。为了充分利用从环境声中提取的Log-Mel谱图的空间特征与通道特征,提出了一种基于密集连接卷积网络(DenseNet)的空间通道注意力机制。使用DenseNet对Log-Mel谱图进行特征提取,引入空间通道注意力机制使网络更加关注显著特征;为了解决数据不足导致的过拟合问题,将混合数据增强的方法应用于Log-Mel谱图,从而保证了数据的多样性;在2个公共数据集(ESC-50和ESC-10)验证所提方法的有效性。结果表明:所提的空间通道注意力机制模型能够使神经网络对环境声音的识别率分别达到79.3%(ESC-50)和94.3%(ESC-10)。 展开更多
关键词 环境声音分类 空间通道注意力机制 密集连接卷积网络 混合数据增强
在线阅读 下载PDF
基于通道注意力机制的行人重识别方法 被引量:10
9
作者 孙义博 张文靖 +2 位作者 王蓉 李冲 张琪 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第5期881-889,共9页
针对行人特征表达不充分的问题,提出了一种基于通道注意力机制的行人重识别方法。将通道注意力机制SE模块嵌入到骨干网络ResNet50中,对关键特征信息进行加权强化;采用动态激活函数,根据输入特征动态调整ReLU的参数,增强网络模型的非线... 针对行人特征表达不充分的问题,提出了一种基于通道注意力机制的行人重识别方法。将通道注意力机制SE模块嵌入到骨干网络ResNet50中,对关键特征信息进行加权强化;采用动态激活函数,根据输入特征动态调整ReLU的参数,增强网络模型的非线性表达能力;将梯度中心化算法引入Adam优化器,提升网络模型的训练速度和泛化能力。在Market1501、DukeMTMC-ReID和CUHK03主流数据集上对改进后的模型进行测试评价,Rank-1分别提升2.17%、2.38%和3.50%,mAP分别提升3.07%、3.39%和4.14%。结果表明:改进后的模型能够提取更强鲁棒性的行人表达特征,达到更高的识别精度。 展开更多
关键词 通道注意力机制 动态激活函数 梯度中心化 特征提取 行人重识别
在线阅读 下载PDF
基于多分支结构的不确定性局部通道注意力机制 被引量:7
10
作者 伍邦谷 张苏林 +3 位作者 石红 朱鹏飞 王旗龙 胡清华 《电子学报》 EI CAS CSCD 北大核心 2022年第2期374-382,共9页
近几年的研究表明视觉注意力机制是提升深层卷积神经网络性能的有效途径.然而,现有的视觉注意力方法更多地致力于建模所有卷积通道之间的相关性,在一定程度上限制了模型的计算效率.此外,这些方法尚未明确考虑相关性建模过程中不确定性... 近几年的研究表明视觉注意力机制是提升深层卷积神经网络性能的有效途径.然而,现有的视觉注意力方法更多地致力于建模所有卷积通道之间的相关性,在一定程度上限制了模型的计算效率.此外,这些方法尚未明确考虑相关性建模过程中不确定性带来的影响,缺少对注意力机制在泛化能力和稳定性方面的探索.为解决上述问题,提出了一种多分支局部通道注意力模块(Multi-Branch Local Channel Attention,MBLCA).通过建模通道之间的局部相关性学习各个通道的权重,提升了模型的计算效率.并采用蒙特卡洛(Monte Carlo,MC)Dropout近似的深度贝叶斯学习方法对局部通道注意力模块进行不确定性建模,从而得到一个多分支的局部通道注意力模块.提出的MBLCA模块可以灵活地应用于各种深层卷积神经网络架构中,与同类型的工作相比,嵌入MBLCA模块的ResNet-50网络结构在ImageNet-1K和MS COCO数据集上分别取得了2.58%的分类精度提升和1.9%的AP提升. 展开更多
关键词 通道注意力机制 不确定性 多分支结构 深层卷积神经网络
在线阅读 下载PDF
基于改进通道注意力机制的农作物病害识别模型研究 被引量:8
11
作者 肖天赐 陈燕红 +2 位作者 李永可 李雨晴 罗玉峰 《江苏农业科学》 北大核心 2023年第24期168-175,共8页
准确地识别农作物病害种类、病害程度,是能够正确防治病害的基础,对农作物的高质量生产有重要意义。针对传统深度学习模型对图像的细粒度分类不够精准的问题,提出不参与残差计算的通道注意力(efficient channel attention without parti... 准确地识别农作物病害种类、病害程度,是能够正确防治病害的基础,对农作物的高质量生产有重要意义。针对传统深度学习模型对图像的细粒度分类不够精准的问题,提出不参与残差计算的通道注意力(efficient channel attention without participating in residual calculation,EWPRC)结构,该结构将改进的通道注意力机制ECANet3放在残差块之后,增加模型对通道维度的权重学习能力,并将EWPRC结构用于骨干网络为ResNet50的迁移学习模型中,通过替换模型中的layer3、layer4层得到了EWPRC-RseNet-t模型。试验使用了AIChallenger 2018数据集,在数据预处理、数据增强、超参数相同的情况下,首先对比了固定核大小为3、5、7、11、13的通道注意力机制对模型准确率的影响,在此试验中,模型的准确率随卷积核变大呈下降趋势,其中一维卷积核大小为3的模型准确率最高,达到了87.42%,比核大小为5、7、11、13的模型分别提高了0.03、0.42、0.51、0.64百分点。再将EWPRC-ResNet-t模型与经过微调的迁移学习模型ResNet-t以及GoogLeNet、MobileNet-v3、ResNet50模型进行对比,以准确率、精确率、召回率以及F1值作为评价指标,试验结果证明EWPRC-ResNet-t模型取得了最好的效果,比传统深度学习模型中准确率最高的ResNet50模型提高了0.99百分点,比ResNet-t模型提高了0.75百分点。且相比传统的深度学习模型,EWPRC-ResNet-t模型有更高的精度、召回率与F1得分。 展开更多
关键词 农作物病害识别 通道注意力机制 残差网络 迁移学习 数据增强
在线阅读 下载PDF
基于高效通道注意力机制与多尺度特征融合的烟丝图像识别方法研究 被引量:2
12
作者 刘江鹏 牛群峰 +3 位作者 靳毅 陈霞 王莉 袁强 《河南农业科学》 北大核心 2022年第11期145-154,共10页
针对现有方法在识别烟丝类型中泛化能力差、准确率低的问题,提出了一种基于高效通道注意力机制与多尺度特征融合的烟丝类型识别方法。对采集的梗丝、膨胀叶丝、叶丝和再造烟丝4类烟丝图像进行降噪处理,处理后的图像经K-means聚类得到图... 针对现有方法在识别烟丝类型中泛化能力差、准确率低的问题,提出了一种基于高效通道注意力机制与多尺度特征融合的烟丝类型识别方法。对采集的梗丝、膨胀叶丝、叶丝和再造烟丝4类烟丝图像进行降噪处理,处理后的图像经K-means聚类得到图像的前景和后景并完成分割,提高输入图像的抗环境干扰能力和特征提取能力。在Inception-ResNet-V2网络中引入高效通道注意力机制,加强模型提取特征的能力;同时,将改进后的模块输出的特征图进行多尺度融合,增加特征代表性,降低过拟合风险。最后,在比较收敛性和准确性时,用PReLU和AdaBound代替了ReLU激活函数和Adam优化器。结果表明,提出的算法具有较好的泛化能力,能实现4类烟丝高效识别,最终识别精度为97.23%,单幅图像的检测时间为0.107 s。 展开更多
关键词 烟丝 K-MEANS算法 Inception网络 高效通道注意力机制 多尺度特征融合
在线阅读 下载PDF
引入重影特征映射和通道注意力机制的手势识别算法 被引量:11
13
作者 范晶晶 薛皓玮 +1 位作者 吴欣鸿 王美丽 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2022年第3期403-414,共12页
针对轻量型目标检测网络对静态手势特征提取能力不足、错检率和漏检率高的问题,基于YOLOv4-tiny网络结构提出轻量型手势识别算法.首先引入表征力更强、成本更低的重影特征映射,增强网络获取多尺度手势特征的能力;然后嵌入通道注意力机... 针对轻量型目标检测网络对静态手势特征提取能力不足、错检率和漏检率高的问题,基于YOLOv4-tiny网络结构提出轻量型手势识别算法.首先引入表征力更强、成本更低的重影特征映射,增强网络获取多尺度手势特征的能力;然后嵌入通道注意力机制实现特征重标定,达到减少背景干扰的目的;最后采用Swish作为主激活函数,进一步提升手势识别准确率.在手势数据集上的实验结果表明,相比YOLOv4-tiny,所提算法具有较优的识别性能;并且对于不同环境条件下的多尺度手势,该算法能够实现精准的分类和实时的检测,对小尺度的手势具有更好的识别效果. 展开更多
关键词 手势识别 轻量型网络 重影特征映射 通道注意力机制
在线阅读 下载PDF
融合累积分布函数和通道注意力机制的DeepLabV3+图像分割算法 被引量:8
14
作者 何雪东 宣士斌 +1 位作者 王款 陈梦楠 《计算机应用》 CSCD 北大核心 2023年第3期936-942,共7页
为了解决DeepLabV3+在语义分割时未充分利用主干的低级特征,以及大倍数上采样造成有效特征缺失的问题,提出一种累积分布通道注意力DeepLabV3+(CDCA-DLV3+)模型。首先,基于累积分布函数和通道注意力提出了累积分布通道注意力(CDCA);然后... 为了解决DeepLabV3+在语义分割时未充分利用主干的低级特征,以及大倍数上采样造成有效特征缺失的问题,提出一种累积分布通道注意力DeepLabV3+(CDCA-DLV3+)模型。首先,基于累积分布函数和通道注意力提出了累积分布通道注意力(CDCA);然后,利用CDCA获取主干部分有效的低级特征;最后,采用特征金字塔网络(FPN)进行特征融合和逐步上采样,从而避免大倍数上采样所造成的特征损失。CDCA-DLV3+模型在Pascal VOC2012验证集与Cityscapes数据集上的平均交并比(mIoU)分别为80.09%和80.11%,相较于DeepLabV3+模型分别提升1.24和1.02个百分点。实验结果表明,所提模型分割结果更加精确。 展开更多
关键词 深度学习 图像语义分割 通道注意力机制 DeepLabV3+ 累积分布函数
在线阅读 下载PDF
基于简单通道注意力机制的单图像超分辨率重建算法 被引量:2
15
作者 高艳鹍 刘一非 +2 位作者 李海生 彭凯康 刘朝晖 《计算机工程与设计》 北大核心 2023年第7期2140-2147,共8页
现有的单图像超分辨率重建算法一般存在重建图像过于失真或将低分辨率图像噪点放大的问题,针对上述两个问题,提出一种基于简单通道注意力机制的生成对抗网络(SCAGAN)模型。采用随机高阶退化模型缓解重建图像过于失真的问题;加入简单通... 现有的单图像超分辨率重建算法一般存在重建图像过于失真或将低分辨率图像噪点放大的问题,针对上述两个问题,提出一种基于简单通道注意力机制的生成对抗网络(SCAGAN)模型。采用随机高阶退化模型缓解重建图像过于失真的问题;加入简单通道注意力机制模块到残差密集块中作为模型的生成器网络模块,解决重建图像将低分辨率图像重建后噪点会放大的问题。实验数据表明,与现有的超分辨率算法相比,该算法有效降低了重建图像过于失真与将低分辨率图像噪点放大的问题,重建出的图像更加真实自然。 展开更多
关键词 超分辨率重建 通道注意力机制 退化模型 数据集构建 残差密集块 生成对抗模型 深度学习
在线阅读 下载PDF
基于空间通道注意力机制与多尺度融合的交通标志识别研究 被引量:9
16
作者 黄志强 李军 《南京邮电大学学报(自然科学版)》 北大核心 2022年第2期93-102,共10页
通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图... 通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图的语义信息,将第19层卷积层通过上采样后与第7层卷积层相连接,多尺度融合后输入YOLO层形成新的特征金字塔,以此提高小目标的识别率。同时,为使网络更加关注交通标志的细节信息,在特征金字塔网络中增添能够增强前景信息降低背景信息的空间通道注意力机制。使用Kmeans聚类算法对数据集作聚类处理,获得一组先验框。在长沙理工大学交通标志数据集上进行测试,实验结果表明,改进后算法的识别率达到91.8%,与YOLOV3-tiny算法相比提高了24.9个百分点,而与YOLOV3算法相比,每张图片的检测时间降低至0.133s,降低了49.6%,该算法具有较强的实时性和准确性。 展开更多
关键词 交通标志 轻量化网络 YOLOV3-3ctiny 多尺度融合 特征金字塔 空间通道注意力机制
在线阅读 下载PDF
融合通道注意力机制和深度编解码卷积网络的道路场景分割 被引量:4
17
作者 黄泽华 丁学明 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2362-2367,共6页
针对深度编解码卷积网络在道路场景分割中没有考虑对各卷积特征图通道依赖性的问题,提出了一种融合通道注意力机制的深度编解码卷积网络,并将通道注意力机制改进为双路通道注意力机制.该方法保留了原有通道注意力机制能优化背景信息的优... 针对深度编解码卷积网络在道路场景分割中没有考虑对各卷积特征图通道依赖性的问题,提出了一种融合通道注意力机制的深度编解码卷积网络,并将通道注意力机制改进为双路通道注意力机制.该方法保留了原有通道注意力机制能优化背景信息的优点,同时增加另一路通道用来收集到难区分物体之间重要的特征,从而获得详细的通道注意力.实验结果表明,对于道路场景图像,融合双路通道注意力机制的深度编解码卷积网络进一步提高了分割性能,其中在评价指标准确率和平均交并比分别提高了约7个百分点和8个百分点. 展开更多
关键词 道路场景分割 深度编解码卷积网络 通道注意力机制 分割性能
在线阅读 下载PDF
基于多通道注意力机制的人脸替换鉴别 被引量:2
18
作者 武茜 贾世杰 《计算机工程》 CAS CSCD 北大核心 2022年第2期180-185,193,共7页
基于深度学习的人脸替换技术取得快速发展,但由DeepFake自动生成的人脸替换图片有可能危害人们的隐私安全。针对DeepFake图片鉴别问题,建立一种基于多通道注意力机制的深度学习鉴别网络模型。将Xception网络作为基础特征提取器,在多通... 基于深度学习的人脸替换技术取得快速发展,但由DeepFake自动生成的人脸替换图片有可能危害人们的隐私安全。针对DeepFake图片鉴别问题,建立一种基于多通道注意力机制的深度学习鉴别网络模型。将Xception网络作为基础特征提取器,在多通道注意力模块中通过矩阵相乘的思想融合全局和局部的注意力表示,以减少重要信息损失。设计损失函数时添加中心损失,从而提高特征区分度。在训练过程中利用注意力图来引导训练图像的裁剪和去除,以达到数据增强的目的。实验结果表明,相比Xception、B4Att方法,在FaceForensics++数据集上该网络模型对DeepFake的检测精度分别提高0.77和0.45个百分点,在Celeb-DF数据集上分别提高5.30和4.68个百分点。 展开更多
关键词 人脸替换 通道注意力机制 图片鉴别 Xception网络 深度学习
在线阅读 下载PDF
基于通道注意力机制的文本生成图像方法 被引量:2
19
作者 张云帆 易尧华 +1 位作者 汤梓伟 王新宇 《计算机工程》 CAS CSCD 北大核心 2022年第4期206-212,222,共8页
针对文本生成图像任务中生成图像细节缺失及低分辨率阶段生成图像存在结构性错误的问题,基于动态注意力机制生成对抗网络(DMGAN),引入内容感知上采样模块和通道注意力卷积模块,提出一种新的文本生成图像方法ECAGAN。在低分辨率图像生成... 针对文本生成图像任务中生成图像细节缺失及低分辨率阶段生成图像存在结构性错误的问题,基于动态注意力机制生成对抗网络(DMGAN),引入内容感知上采样模块和通道注意力卷积模块,提出一种新的文本生成图像方法ECAGAN。在低分辨率图像生成阶段的特征图上采样过程中采用基于内容感知的上采样方法,通过输入特征图计算得到重组卷积核,使用重组卷积核和特征图进行卷积操作,确保上采样后的特征图和文本条件的语义一致性,使生成的低分辨率图像更加准确,利用通道注意力卷积模块学习特征图各个特征通道的重要程度,突出重要的特征通道,抑制无效信息,使生成图像的细节更丰富。此外在训练过程中结合条件增强和感知损失函数辅助训练,增强训练过程的鲁棒性,提高生成图像质量。在CUB-200-2011数据集上的实验结果表明,ECAGAN模型初始分数达到了4.83,R值达到了75.62,与DMGAN方法相比,分别提高了1.6%和4.6%,并且可改善生成图像结构错乱的问题,同时能够生成清晰的图像细节,语义一致性更高,更加接近真实图像。 展开更多
关键词 生成对抗网络 文本生成图像 通道注意力机制 内容感知上采样 感知损失
在线阅读 下载PDF
基于通道注意力机制的单目深度估计 被引量:3
20
作者 张聪 马燕新 +2 位作者 万建伟 许可 徐国权 《信号处理》 CSCD 北大核心 2022年第11期2332-2341,共10页
现有单目深度估计(Monocular depth estimation)算法存在细节估计不准确、同一平面距离估计错误的问题。深度信息是通过图像像素的三通道信息估计出来的,目前已有的算法中很少考虑特征图通道之间的相互关系对深度信息的影响。因此本文... 现有单目深度估计(Monocular depth estimation)算法存在细节估计不准确、同一平面距离估计错误的问题。深度信息是通过图像像素的三通道信息估计出来的,目前已有的算法中很少考虑特征图通道之间的相互关系对深度信息的影响。因此本文提出了一种SE-DenseDepth网络,在网络的编码器中嵌入通道注意力机制,依据不同通道对深度信息的贡献度差异,对通道进行编码,提高编码器对图像特征的表征能力。为了获得图像精细的深度信息,网络建立编码器到解码器的跳连接,引入了更多的低层信息。本文在通用室内数据集NYU-Depth V2上训练,并在真实数据上测试。实验结果表明,本文提出的方法在深度突然变化的细节区域表现更好,在远距离大平面的情况下不会出现深度的断层,与其他主流算法相比可以获得较好的深度估计性能。 展开更多
关键词 单目深度估计 通道注意力机制 多尺度特征提取
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部