期刊文献+
共找到110篇文章
< 1 2 6 >
每页显示 20 50 100
混合多通道联合学习和双分支注意力融合的动作识别
1
作者 卢少同 王传旭 《计算机工程与应用》 北大核心 2025年第8期145-154,共10页
针对现有骨架动作识别方法对不同通道之间的时空特征提取不充分,以及难以充分融合不同尺度特征的问题,提出混合多通道联合学习和双分支注意力融合的动作识别模型。通过构建混合多通道图拓扑结构,联合学习关节在不同通道之间的相似性和... 针对现有骨架动作识别方法对不同通道之间的时空特征提取不充分,以及难以充分融合不同尺度特征的问题,提出混合多通道联合学习和双分支注意力融合的动作识别模型。通过构建混合多通道图拓扑结构,联合学习关节在不同通道之间的相似性和差异性,从而实现了对不同通道之间的时空特征提取。同时,提出接受域多样化的双分支注意力融合模块,通过注意力机制动态分配局部和全局特征权重以实现不同尺度信息之间的上下文相关性融合。该模型在两个公共数据集NTU-RGB+D 60和NTU-RGB+D 120上进行了多组对比实验。实验结果表明,在NTU-RGB+D 60和NTU-RGB+D 120数据集上的分类准确率分别达到了96.5%和90.7%。 展开更多
关键词 动作识别 混合多通道特征聚合 注意力融合
在线阅读 下载PDF
基于多尺度注意力融合的叶绿素a水质参数反演研究
2
作者 孙帮勇 巩凯杰 +1 位作者 于涛 别倩雯 《光谱学与光谱分析》 北大核心 2025年第4期1190-1200,共11页
水资源是生态环境核心要素之一,目前大量的水域被工业化污染或富营养化破坏,因此实时监测水质参数对于维护水体健康至关重要。传统水质监测多利用实地采样测量法或基于线性回归预测法,由于遥感图像与水质参数之间显著的非线性特征,传统... 水资源是生态环境核心要素之一,目前大量的水域被工业化污染或富营养化破坏,因此实时监测水质参数对于维护水体健康至关重要。传统水质监测多利用实地采样测量法或基于线性回归预测法,由于遥感图像与水质参数之间显著的非线性特征,传统方法费时费力且预测精度不高。深度学习方法在处理复杂非线性问题中表现出良好性能,已被多位学者应用到水质参数反演中。基于深度学习的水质反演模型仍存在解析遥感光谱图像特征不精确、模型泛化能力差等问题。提出一种基于多尺度注意力融合机制的水质反演网络模型,能够采用遥感光谱图像准确预测出叶绿素a等水质参数,为水域健康程度评价提供依据。该网络融合了先进的注意力机制和特征融合策略,通过结合CNN的局部特征学习优势和Transformer的全局特征提取能力,引入了DenseASPP模块来获取遥感图像的多尺度特征,并采用通道注意力解码器模块和池化融合模块来提取细节特征。通过融合不同尺度和层次的特征信息对叶绿素a浓度进行估计,获得了较高的反演精度和泛化性能。为验证所提出反演模型的性能,实验在Python3.7和PyTorch框架下对模型进行实现,并选择2021年1月至2022年12月的海洋遥感光谱图像和叶绿素a浓度数据进行网络训练。实验对所提出的方法与其他7种水质反演方法进行对比,客观指标所提出方法均达到了最好的性能,较对比方法中最好的在R2指标上提高了0.09,在RMSE、MAE、MAD指标上分别降低了11.99、0.089、0.029,在Evar指标上提高了0.098,在NSE指标上提高了0.041;在主观评价上,所提出方法获得的叶绿素a浓度更精确,误差更小,不同水域中表现的泛化能力更强。 展开更多
关键词 水质反演 叶绿素A 遥感光谱图像 多尺度注意力融合
在线阅读 下载PDF
Transformer-CNN特征跨注意力融合学习的行人重识别 被引量:3
3
作者 项俊 张金城 +1 位作者 江小平 侯建华 《计算机工程与应用》 CSCD 北大核心 2024年第16期94-104,共11页
卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特... 卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特点,在丰富行人局部特征的同时改善特征的全局表达能力。该模型由三个部分构成:CNN分支主要提取局部细节信息;Transformer分支侧重于关注全局特征信息;跨注意力融合分支通过自注意力机制计算上述两个分支特征的相关性,进而实现特征融合,最终提高模型的表征能力。剥离实验以及在Market1501和DukeMTMC-reID数据集的实验结果证明了所提方法的有效性。 展开更多
关键词 行人重识别 卷积神经网络(CNN) TRANSFORMER 注意力融合学习
在线阅读 下载PDF
基于跨模态注意力融合的煤炭异物检测方法 被引量:5
4
作者 曹现刚 李虎 +3 位作者 王鹏 吴旭东 向敬芳 丁文韬 《工矿自动化》 CSCD 北大核心 2024年第1期57-65,共9页
为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采... 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采用浅层的特征提取策略提取Depth图像的低级特征,用深度边缘与深度纹理等基础特征辅助RGB图像深层特征,以有效获得2种特征的互补信息,从而丰富异物特征的空间与边缘信息,提高检测精度;构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块(CAFM),以协同优化并融合RGB特征与Depth特征,增强网络对特征图中被遮挡异物可见部分的关注度,提高被遮挡异物检测精度;使用区域卷积神经网络(R-CNN)输出煤炭异物的分类、回归与分割结果。实验结果表明:在检测精度方面,该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%;在检测效率方面,该方法的单帧检测时间为110.5 ms,能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征,准确识别煤炭异物之间及煤炭异物与输送带之间的差异,从而有效提高对复杂特征异物的检测精度,减少误检、漏检现象,实现复杂特征下煤炭异物的精确检测与像素级分割。 展开更多
关键词 煤炭异物检测 实例分割 双特征金字塔网络 跨模态注意力融合 Depth图像 坐标注意力 改进空间注意力
在线阅读 下载PDF
基于层级化注意力融合的航拍图像电力线分割模型 被引量:1
5
作者 徐丹 余南南 +2 位作者 张嘉睿 于贺 于金扣 《南方电网技术》 CSCD 北大核心 2024年第4期162-170,共9页
电力线自动分割是保证智能检测平台安全运行的重要前提。然而,电力线分割是复杂背景、多种气候环境下的小目标分割问题,极易出现误检、漏检问题。为了提高电力线分割的鲁棒性与准确性,结合编码器-解码器框架,提出了一种基于层级化注意... 电力线自动分割是保证智能检测平台安全运行的重要前提。然而,电力线分割是复杂背景、多种气候环境下的小目标分割问题,极易出现误检、漏检问题。为了提高电力线分割的鲁棒性与准确性,结合编码器-解码器框架,提出了一种基于层级化注意力融合的端到端分割模型。该模型提出一种降维残差卷积单元,增加网络深度的同时大幅度减少网络参数,更易部署于嵌入式设备。为了使模型捕捉到全局信息并强调电力线的目标区域,设计了链式层级化注意力融合模块进行多尺度特征融合,以解决类别不均衡问题。为了提高模型对电力线特有的直线先验特征的关注,提出了直线先验损失函数,并与Focal、Dice损失函数组合成联合损失函数,进一步提高了电力线分割准确度。实验结果表明,所提模型网络深度增加为基础网络的2.8倍左右,而参数量仅为原来的1/3左右。针对常规天气和雾天环境下的航拍图像均能实现电力线的鲁棒分割。所提出模型能应用于电力巡检领域,使巡检更加智能与高效。 展开更多
关键词 航拍图像 电力线分割 残差卷积 注意力融合 直线先验
在线阅读 下载PDF
基于多尺度频率通道注意力融合的声纹库构建方法
6
作者 陈彤 杨丰玉 +2 位作者 熊宇 严荭 邱福星 《计算机应用》 CSCD 北大核心 2024年第8期2407-2413,共7页
为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Ne... 为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Network)的基础上作了3点改进,包括:加入了多尺度频率通道注意力前端以从话语中获得高分辨率的特征表示、添加了多尺度通道注意力模块结合局部和全局的特征以融合多尺度信息、嵌入了特征注意力融合模块为多尺度的融合特征加权。这些改进使模型更好地利用多尺度的时频信息,提高识别能力。实验结果表明,与ECAPA-TDNN模型相比,MFCA-TDNN模型等错误率(EER)和最小检测代价函数(minDCF)分别下降5.9%和7.9%;最低的EER可达到3.83%,最低的minDCF可达到0.2202。 展开更多
关键词 声纹库 时延神经网络 多尺度特征提取 频率通道注意力 特征注意力融合
在线阅读 下载PDF
一种适用于轴承故障诊断半监督学习分类的多层图卷积注意力融合网络 被引量:1
7
作者 魏春虎 程峰 +1 位作者 曾玉海 杨世飞 《机电工程》 CAS 北大核心 2024年第8期1364-1375,共12页
图卷积网络的平滑运行会导致其无法通过深度网络堆叠捕获深层信息,为了解决这个问题,提出了一种适用于滚动轴承故障诊断半监督学习分类的多层图卷积注意力融合网络(MGCAN)。首先,采用频域构图法将数据转换为图模型,捕获了数据的内在结... 图卷积网络的平滑运行会导致其无法通过深度网络堆叠捕获深层信息,为了解决这个问题,提出了一种适用于滚动轴承故障诊断半监督学习分类的多层图卷积注意力融合网络(MGCAN)。首先,采用频域构图法将数据转换为图模型,捕获了数据的内在结构信息,将构建好的图数据输入网络,逐层提取特征信息,从浅层到深层逐步加深对数据特征的理解;然后,对每一层图卷积信息进行了有序拼接,同时引入了图注意力机制,使网络能够自动关注对分类任务比较重要的信息,从而提高了网络的性能和鲁棒性;最终,通过迭代学习,网络能够不断优化模型参数,对故障信息进行了准确识别;对不同工作条件下的滚动轴承进行了多次实验,并将该方法与传统的基于深度学习的方法进行了分析比较。研究结果表明:即使在标记数据只有10%的前提下,采用该网络依旧能够达到88%以上的识别准确度,并且适用于匀速和变速等不同的工况。上述结果证明,在选择适当方法保留多层图卷积中的有用信息后,深度图卷积网络可以成为诊断滚动轴承故障的一大利器。 展开更多
关键词 轴承故障诊断 多层图卷积注意力融合网络 多层图卷积信息 注意力机制 k-近邻图 深度学习 识别准确度
在线阅读 下载PDF
可变形分支注意力融合网络的胰腺分割方法
8
作者 付艳贞 樊建聪 《小型微型计算机系统》 CSCD 北大核心 2024年第11期2717-2724,共8页
胰腺具有尺寸小、形状不规则且多变的特点,因此在腹部CT图像中自动分割胰腺具有极大的挑战性.为了适应胰腺特征并解决其分割困难的问题,本文提出了一种轻量级的可变形分支注意力融合网络(Deformable Branch Attention Fusion Network,DB... 胰腺具有尺寸小、形状不规则且多变的特点,因此在腹部CT图像中自动分割胰腺具有极大的挑战性.为了适应胰腺特征并解决其分割困难的问题,本文提出了一种轻量级的可变形分支注意力融合网络(Deformable Branch Attention Fusion Network,DBA-Net)作为胰腺自动分割方法.该方法首先将候选区域裁剪出来作为网络的输入,以便减少背景干扰并突出胰腺区域;然后引入可变形卷积使网络自适应地学习胰腺的空间结构;最后提出分支注意力融合模块实现低级别特征和高级别特征的融合,帮助解码器更好地还原特征图.本文的方法在NIH数据集上测试的Dice相似系数为85.3%,在MSD数据集上的Dice相似系数为78.9%,相比基线U-Net分别提高了3.9%和5.6%.实验结果表明本文的方法能够对胰腺进行更好的分割. 展开更多
关键词 胰腺分割 轻量级 可变形卷积 分支注意力融合模块
在线阅读 下载PDF
基于双重注意力融合和空洞残差特征增强的场景文本检测 被引量:1
9
作者 李利荣 张开 +4 位作者 陈鹏 周蕾 乐玲 熊炜 巩朋成 《激光杂志》 CAS 北大核心 2022年第1期45-51,共7页
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块... 针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空洞残差特征增强(D-RFA)模块。通过在弯曲文本数据集CTW1500上的测试表明,该方法的准确率、召回率和F值分别达到了87.8%、84.2%和86.0%,同时在多方向文本数据集ICDAR2015上也有良好的表现,证明了该方法在各种形状文本检测上的有效性。 展开更多
关键词 场景文本检测 双向特征金字塔 双重注意力融合 空洞残差特征增强
在线阅读 下载PDF
多尺度注意力融合和抗噪声的轻量点云人脸识别模型 被引量:4
10
作者 郭文 李冬 袁飞 《图学学报》 CSCD 北大核心 2022年第6期1124-1133,共10页
在低质量点云人脸数据集上,判别性特征的提取和模型对噪声的鲁棒性是解决点云人脸识别问题的关键。针对现有轻量点云人脸识别算法不能充分提取判别性特征和数据集中存在大量噪声而影响模型训练的问题,设计轻量高效的网络模型,提出了基... 在低质量点云人脸数据集上,判别性特征的提取和模型对噪声的鲁棒性是解决点云人脸识别问题的关键。针对现有轻量点云人脸识别算法不能充分提取判别性特征和数据集中存在大量噪声而影响模型训练的问题,设计轻量高效的网络模型,提出了基于多尺度注意力融合和抗噪声的自适应损失函数的点云人脸识别算法。首先通过不同卷积模块获得不同感受野大小的特征图。然后进行多尺度的注意力特征提取,并使用高层的注意力权重来引导低层注意力权重的生成,最后进行通道融合得到多尺度融合的特征,提升了模型捕获人脸细节特征的能力。其次,根据低质量点云人脸图像的噪声信息特点,设计了一种新颖的抗噪声的自适应损失函数(anti-noise adaptiveloss),以应对数据集大量噪声对模型训练过程中可能造成的负面影响,提升模型的鲁棒性和泛化能力。在开源数据集Lock3DFace和本文提出的KinectFaces数据集上的实验结果表明,与当前的主流算法相比该算法模型在低质量点云人脸识别任务中具有更好的识别效果。 展开更多
关键词 点云人脸识别 注意力融合 注意力特征提取 损失函数
在线阅读 下载PDF
基于残差注意力融合和门控信息蒸馏的图像修复 被引量:2
11
作者 余映 何鹏浩 徐超越 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第12期49-59,共11页
图像修复在计算机视觉任务中具有重大的意义和价值。近年来,基于深度学习的图像修复模型被广泛应用于该领域中。但是现有的深度学习图像修复模型存在对破损图像中有效信息的利用不足和受破损图像中掩码信息干扰的问题,从而导致修复出的... 图像修复在计算机视觉任务中具有重大的意义和价值。近年来,基于深度学习的图像修复模型被广泛应用于该领域中。但是现有的深度学习图像修复模型存在对破损图像中有效信息的利用不足和受破损图像中掩码信息干扰的问题,从而导致修复出的图像的部分结构缺失和部分细节模糊。为此,文中提出了基于残差注意力融合和门控信息蒸馏的图像修复模型。首先,该图像修复模型由生成器和鉴别器两部分组成,生成器的主干结构采用U-Net网络,由编码器和解码器组成;鉴别器采用马尔可夫鉴别器,由6个卷积层组成。然后,在编码器和解码器中分别构建残差注意力融合结构,以增强破损图像中有效信息的利用和减少掩码信息的干扰。最后,在编码器和解码器的跳跃连接中嵌入门控信息蒸馏模块,进一步提取待修复图像中的有效低级特征。在公开人脸和街景数据集上的实验结果表明:文中模型在语义结构和纹理细节方面具有更好的修复效果;文中模型的结构相似性、峰值信噪比、平均绝对值误差、最小平方误差和弗雷歇距离指标均优于5种对比模型,说明文中模型的修复质量优于对比模型。 展开更多
关键词 深度学习 图像修复 残差注意力融合 门控信息蒸馏
在线阅读 下载PDF
基于组件特征与多注意力融合的车辆重识别方法 被引量:3
12
作者 胡煜 陈小波 +2 位作者 梁军 陈玲 梁书荣 《计算机研究与发展》 EI CSCD 北大核心 2022年第11期2497-2506,共10页
为提升车辆重识别算法的性能,提出一种基于车辆组件特征与多注意力融合的特征学习方法.首先,修改深度残差网络以获取具有丰富语义信息的特征图,同时应用语义分割网络将车辆图像划分为车辆正面、背面、顶面、侧面及背景区域,以实现组件... 为提升车辆重识别算法的性能,提出一种基于车辆组件特征与多注意力融合的特征学习方法.首先,修改深度残差网络以获取具有丰富语义信息的特征图,同时应用语义分割网络将车辆图像划分为车辆正面、背面、顶面、侧面及背景区域,以实现组件特征提取并消除视角变化的影响.然后,设计多注意力融合模块,基于面积注意力与特征注意力实现组件特征的自适应融合.最后,在多任务学习框架下,优化车辆重识别的三元组损失与辅助分类任务的交叉熵与焦点损失,对网络参数进行训练.在多个数据集上的实验结果表明,提出的方法在大多数性能指标上均超越了现有方法.进一步的消融实验证明了多注意力融合模块与多任务损失函数在特征提取上的有效性. 展开更多
关键词 车辆重识别 组件特征抽取 特征对齐 组件注意力模块 注意力融合
在线阅读 下载PDF
基于统一注意力融合网络的耕地变化检测 被引量:2
13
作者 李滔 王海瑞 朱贵富 《计算机科学》 CSCD 北大核心 2023年第S02期993-998,共6页
为了快速摸清农村乱占耕地建房底数,实现对侵占耕地房屋的检测,提出了一种统一注意力融合网络(Unified Attention Fusion Network)用于农村占用耕地建房识别。为了解决不同时相遥感影像特征相互影响的问题,首先使用孪生网络代替VGG16网... 为了快速摸清农村乱占耕地建房底数,实现对侵占耕地房屋的检测,提出了一种统一注意力融合网络(Unified Attention Fusion Network)用于农村占用耕地建房识别。为了解决不同时相遥感影像特征相互影响的问题,首先使用孪生网络代替VGG16网络进行特征提取。其次,为了在增大网络感受野并获取更多多尺度信息的前提下减小网络模型大小,在编码阶段最底层使用了简易金字塔池化(Simple Pyramid Pooling Module,SPPM);在解码阶段,为了提高分割精度,突出有用特征,提高边缘分割精度,使用统一注意力融合模块(Unified Attention Fusion Module,UAFM)替换原始的上采样部分进行解码,获取变化检测结果。网络在占用耕地建房数据集上进行了训练和测试。实验结果表明,统一注意力融合网络在测试集上准确率(Accuracy)达到98.82%、精确率(Precision)达到89.69%、召回率(Recall)达到82.14%、F1分数(F1 Score)达到85.74%,能够快速识别不同尺度的疑似占用耕地的违建房屋,为农村乱占耕地建房整治工作提供一种技术检测方法。 展开更多
关键词 遥感影像 变化检测 建筑物检测 统一注意力融合网络 简易金字塔池化
在线阅读 下载PDF
基于自适应注意力融合特征提取网络的图像超分辨率 被引量:6
14
作者 王拓然 程娜 +1 位作者 丁士佳 王洪玉 《计算机应用研究》 CSCD 北大核心 2023年第11期3472-3477,3508,共7页
为了应对当前大型图像超分辨率模型参数过多难以部署,以及现有的轻量级图像超分辨率模型性能表现不佳的问题,提出了一种基于自适应注意力融合特征提取网络的图像超分辨率模型。该模型主要由一个大核注意力模块和多个高效注意力融合特征... 为了应对当前大型图像超分辨率模型参数过多难以部署,以及现有的轻量级图像超分辨率模型性能表现不佳的问题,提出了一种基于自适应注意力融合特征提取网络的图像超分辨率模型。该模型主要由一个大核注意力模块和多个高效注意力融合特征提取模块组成。首先,利用大核注意力模块进行浅层特征提取,然后将提取到的浅层特征信息输入级联的高效注意力融合特征提取模块进行深层特征提取、增强、细化和再分配的聚合操作。高效注意力融合特征提取模块由三个部分组成,分别是渐进式残差特征提取模块、通道对比度感知注意力模块和通道—空间联合注意力模块。该网络可以在利用少量参数的情况下实现更好的图像超分辨率性能,是一种表现优异的轻量级图像超分辨率模型。通过在流行的基准数据集上评估提出的方法,并与现有的一些方法进行对比,结果表明该方法的表现更优异。 展开更多
关键词 图像超分辨率 轻量化模型 大核注意力 注意力融合特征提取
在线阅读 下载PDF
基于标签推理和注意力融合的多标签文本分类方法 被引量:5
15
作者 田雨薇 张智 《计算机应用研究》 CSCD 北大核心 2022年第11期3315-3319,3326,共6页
目前许多多标签文本分类方法主要关注文档表示,而丢失了大量标签相关的语义信息,导致分类效果不理想。针对以上问题,提出一种基于标签推理和注意力融合的分类方法,挖掘文档中与标签相关的特征以及相似标签之间的相关性,学习标签信息进... 目前许多多标签文本分类方法主要关注文档表示,而丢失了大量标签相关的语义信息,导致分类效果不理想。针对以上问题,提出一种基于标签推理和注意力融合的分类方法,挖掘文档中与标签相关的特征以及相似标签之间的相关性,学习标签信息进行标签推理,同时采用注意力机制自学习地融合文档表示和标签表示,最终完成多标签分类任务。在AAPD和RCV1-V2数据集上进行实例验证,该方法的F_(1)值分别达到了0.732和0.887,与其他最新方法相比其准确度均有提升,实验结果证明了标签推理和注意力融合策略的有效性。 展开更多
关键词 标签推理 注意力融合 多标签文本分类
在线阅读 下载PDF
从全局到局部:双注意力融合去雾网络 被引量:2
16
作者 杨瑷玮 王华珂 侯兴松 《西安交通大学学报》 EI CAS CSCD 北大核心 2023年第7期191-200,共10页
为了处理现有的基于卷积神经网络去雾方法只使用单一的注意力、很难生成细节生动的清晰图像,且容易导致色彩失真的问题,提出了一个全局与局部注意力融合的图像去雾方法,以获得正常清晰度和无色彩失真的去雾图像。首先利用通道注意力将... 为了处理现有的基于卷积神经网络去雾方法只使用单一的注意力、很难生成细节生动的清晰图像,且容易导致色彩失真的问题,提出了一个全局与局部注意力融合的图像去雾方法,以获得正常清晰度和无色彩失真的去雾图像。首先利用通道注意力将输入的有雾图像在通道维度切分为两部分,一部分送入通道像素注意力通道抽取局部特征,另一部分送入Transformer通道学习全局特征,然后利用像素注意力对两个通道学习的特征进行融合,将上述模块作为基本单元组合为一个多级U型去雾网络,增加残差连接缓解上下采样导致的细节信息丢失,最后在网络底层加入一个Transformer模块学习全局信息。在多个公开可用的去雾图像数据集RESIDE SOTS Indoor、RESIDE SOTS Outdoor上测试所提方法的有效性,结果表明:对比经典的去雾方法,所提网络生成的图像细节更丰富并且色彩失真最少;在RESIDE SOTS Outdoor数据集上,相比经典的FFA-Net,峰值信噪比提高1.16 dB,相比GridDehazeNet,峰值信噪比提高3.68 dB。提出的全局与局部注意力融合方法能有效地去除雾霾,提升图像的对比度与清晰度,设计的多级U型去雾网络和残差连接结构能够缓解细节丢失,提升去雾效果,获得清晰的图像。 展开更多
关键词 图像去雾 全局与局部注意力融合 通道像素注意力 Transformer模块
在线阅读 下载PDF
面向交通场景解析的局部和全局上下文注意力融合网络 被引量:1
17
作者 王泽宇 布树辉 +3 位作者 黄伟 郑远攀 吴庆岗 张旭 《计算机应用》 CSCD 北大核心 2023年第3期713-722,共10页
为解决交通场景解析中局部和全局上下文信息自适应聚合的问题,提出3模块架构的局部和全局上下文注意力融合网络(LGCAFN)。前端的特征提取模块由基于串联空洞空间金字塔池化(CASPP)单元改进的ResNet-101组成,能够更加有效地提取物体的多... 为解决交通场景解析中局部和全局上下文信息自适应聚合的问题,提出3模块架构的局部和全局上下文注意力融合网络(LGCAFN)。前端的特征提取模块由基于串联空洞空间金字塔池化(CASPP)单元改进的ResNet-101组成,能够更加有效地提取物体的多尺度局部特征;中端的结构化学习模块由8路长短期记忆(LSTM)网络分支组成,可以更加准确地推理物体邻近8个不同方向上场景区域的空间结构化特征;后端的特征融合模块采用基于注意力机制的3阶段融合方式,能够自适应地聚合有用的上下文信息并屏蔽噪声上下文信息,且生成的多模态融合特征能够更加全面且准确地表示物体的语义信息。在Cityscapes标准和扩展数据集上的实验结果表明,相较于逆变换网络(ITN)和对象上下文表示网络(OCRN)等方法,LGCAFN实现了最优的平均交并比(mIoU),达到了84.0%和86.3%,表明LGCAFN能够准确地解析交通场景,有助于实现车辆自动驾驶。 展开更多
关键词 交通场景解析 自适应聚合 串联空洞空间金字塔池化 长短期记忆 注意力融合
在线阅读 下载PDF
基于多维注意力融合的驾驶场景分割增强算法
18
作者 刘奕晨 章坚武 胡晶 《计算机应用研究》 CSCD 北大核心 2023年第10期3180-3185,共6页
针对使用注意力机制的语义分割模型计算资源消耗与精度不平衡的问题,提出一种轻量化的语义分割注意力增强算法。首先,基于驾驶场景中物体的形状特点设计了条状分维注意力机制,使用条形池化代替传统方形卷积,并结合降维操作分维度提取长... 针对使用注意力机制的语义分割模型计算资源消耗与精度不平衡的问题,提出一种轻量化的语义分割注意力增强算法。首先,基于驾驶场景中物体的形状特点设计了条状分维注意力机制,使用条形池化代替传统方形卷积,并结合降维操作分维度提取长程语义关联,削减模型计算量。接着融合通道域与空间域上的注意力,形成可叠加与拆解的轻量化多维注意力融合模块,全方位提取特征信息,进一步提升模型精度。最后,将模块插入基于ResNet-101骨干网的编码—解码网络中,指导高低层语义融合,矫正特征图边缘信息,补充预测细节。实验表明,该模块有较强的鲁棒性和泛化能力,与同类型注意力机制相比,削减了约90%的参数量以及80%的计算量,且分割精度依旧取得了稳定的提升。 展开更多
关键词 语义分割 注意力机制 条状特征提取 多维注意力融合
在线阅读 下载PDF
基于多层交叉注意力融合网络模型的人脸图像情感分析 被引量:1
19
作者 邓亚萍 王新 尹甜甜 《科学技术与工程》 北大核心 2023年第3期1152-1159,共8页
目前大多数人脸图像情感分析方法只单方面关注图像整体或局部来构建视觉情感特征表示,忽略了二者在情感表达上的协同作用。针对此问题,提出了一种多层交叉注意力融合网络情感分析方法。该方法首先利用特征相关性分析实现最大化类的可分... 目前大多数人脸图像情感分析方法只单方面关注图像整体或局部来构建视觉情感特征表示,忽略了二者在情感表达上的协同作用。针对此问题,提出了一种多层交叉注意力融合网络情感分析方法。该方法首先利用特征相关性分析实现最大化类的可分性;其次通过多层交叉注意力网络中的多个不重叠的注意力区域来提取整体和局部的信息;然后将整体与局部提取的注意力图进行融合,来共同训练图像情感分类器并进行情感分析。实验结果表明,提出的方法在真实数据集RAFDB上的情感分类准确率达到了88.53%,优于现有其他方法,验证了该方法的有效性与优越性。 展开更多
关键词 多层交叉注意力 特征相关性分析 整体-局部 注意力融合 情感分析
在线阅读 下载PDF
多视角多注意力融合分子特征的药物-靶标亲和力预测 被引量:2
20
作者 王润泽 张月琴 +2 位作者 秦琪琦 张泽华 郭旭敏 《计算机应用》 CSCD 北大核心 2022年第1期325-332,共8页
近期深度学习在药物-靶标亲和力(DTA)任务上受到极大关注,然而现有工作多将分子单一结构嵌入为向量,忽略了多视角融合分子特征对最终特征表示提供的信息增益。针对单一结构分子存在特征不完备性的问题,提出了一种基于注意力融合多视角... 近期深度学习在药物-靶标亲和力(DTA)任务上受到极大关注,然而现有工作多将分子单一结构嵌入为向量,忽略了多视角融合分子特征对最终特征表示提供的信息增益。针对单一结构分子存在特征不完备性的问题,提出了一种基于注意力融合多视角分子特征的预测DTA的端到端深度学习方法,其核心模块为多视角分子结构嵌入(Mas)和多注意力特征融合(Mat)。首先,使用Mas模块将多视角分子结构嵌入到特征向量空间;然后,通过Mat模块融入分子特征层级的注意力机制,从而对不同视角的分子特征进行加权融合;其次,根据药物-靶标相互作用(DTI)执行两者特征级联;最后,利用全连接神经网络回归预测亲和力。在Davis和KIBA数据集上的实验验证了训练比率、多视角特征融入、多注意力融合、以及相关参数对亲和力预测性能的影响。与GraphDTA方法相比,所提方法的均方误差(MSE)在Davis和KIBA两个数据集上分别降低了4.8%和6%。实验结果表明,注意力融合多视角分子特征能够捕获对蛋白质靶位上链接的相关性更高的分子特征。 展开更多
关键词 药物-靶标亲和力预测 注意力分子特征融合 多视角分子结构嵌入 分子特征层级 注意力机制
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部