期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
面向分割的局部分块与全局多尺度注意力机制
1
作者 谭荆彬 赵旭俊 苏慧娟 《计算机工程与设计》 北大核心 2025年第4期1141-1148,共8页
现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个... 现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个小块,分别计算这些小块的注意力得分,增强对局部信息的感知能力。使用一组空洞卷积计算整个特征图的得分,获得全局多尺度信息的权衡。实验中,将PGMA集成到U-Net、DeepLab、SegNet等语义分割网络中,有效提升了它们的分割性能。这表明PGMA在增强CNN性能方面优于当前主流方法。 展开更多
关键词 卷积神经网络 注意力机制 局部信息 分块策略 细节感知 全局多尺度信息 语义分割
在线阅读 下载PDF
双向建模增强TKAN和全局注意力机制融合的滚动轴承剩余寿命预测
2
作者 姜蕾 郑建飞 +3 位作者 胡昌华 赵瑞星 韩其辉 杨立浩 《自动化学报》 北大核心 2025年第8期1857-1868,共12页
滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键.针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题,提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺... 滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键.针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题,提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺尔德注意力网络(Bi-TKAN-Att).该模型兼具了时序科尔莫戈洛夫−阿诺尔德网络的强时序建模能力和全局注意力机制的关键特征提取能力,采用双向建模的方式捕捉前后向信息,最终实现了具有长期依赖多维退化特征的滚动轴承RUL预测.所提方法在滚动轴承数据集上进行实验验证,结果表明Bi-TKAN-Att模型在捕获滚动轴承退化特性和提升RUL预测精度方面具有显著优势,并通过消融实验证明了模型各组件的合理性和有效性,为滚动轴承的寿命预测提供了全新可行的解决方案. 展开更多
关键词 剩余使用寿命预测 滚动轴承 时序科尔莫戈洛夫-阿诺尔德网络 双向建模 全局注意力机制
在线阅读 下载PDF
整合边缘卷积与全局-局部自注意力的机载点云分类
3
作者 涂静敏 严进 +3 位作者 李礼 姚剑 李婕 康妍斐 《光学精密工程》 CSCD 北大核心 2024年第24期3658-3673,共16页
激光点云分类是实现三维场景理解的基础。针对机载点云大场景分类中存在的特征表达不足、样本类别不均衡的问题,本文提出一种整合边缘卷积与全局-局部自注意力的机载点云分类方法。首先,以U-net为网络框架,融合Point Transformer与边缘... 激光点云分类是实现三维场景理解的基础。针对机载点云大场景分类中存在的特征表达不足、样本类别不均衡的问题,本文提出一种整合边缘卷积与全局-局部自注意力的机载点云分类方法。首先,以U-net为网络框架,融合Point Transformer与边缘卷积模块,使得模型能够关注到复杂地物边界和纹理信息,获得表达能力更好的局部几何特征。其次,创新性地提出一种融合全局上下文信息和局部结构特征的自注意力机制,全局自注意力模块倾向于整个输入序列的信息,而局部自注意力模块则更注重于局部区域的细节。两种机制结合增强了对长距离依赖关系和局部结构的捕捉,同时使得模型能够兼顾少数类别的关键特征,在一定程度上降低样本类别不均衡对分类精度的影响,有助于提高模型对复杂地物关系的分类能力。最后,在公开的ISPRS-3D数据集和WHU-Urban3D数据集上对本文所提出的方法进行验证,实验结果表明,该方法在两个数据集上的分类精度分别为82.5%和87.4%,优于PointNet++,Stratified Transformer等经典网络及ISPRS 3D官网竞赛网络,可有效提升机载点云分类精度。 展开更多
关键词 机载激光雷达 点云分类 边缘卷积 全局-局部注意力 U-net
在线阅读 下载PDF
GLCrowd:基于全局-局部注意力的弱监督密集场景人群计数模型 被引量:1
4
作者 张红民 田钱前 +1 位作者 颜鼎鼎 卜令宇 《光电工程》 CAS CSCD 北大核心 2024年第10期75-86,共12页
针对人群计数在密集场景下存在背景复杂、尺度变化大等问题,提出了一种结合全局-局部注意力的弱监督密集场景人群计数模型——GLCrowd。首先,设计了一种结合深度卷积的局部注意力模块,通过上下文权重增强局部特征,同时结合特征权重共享... 针对人群计数在密集场景下存在背景复杂、尺度变化大等问题,提出了一种结合全局-局部注意力的弱监督密集场景人群计数模型——GLCrowd。首先,设计了一种结合深度卷积的局部注意力模块,通过上下文权重增强局部特征,同时结合特征权重共享获得高频局部信息。其次,利用Vision Transformer(ViT)的自注意力机制捕获低频全局信息。最后,将全局与局部注意力有效融合,并通过回归令牌来完成计数。在Shanghai Tech PartA、Shanghai Tech PartB、UCF-QNRF以及UCF_CC_50数据集上进行了模型测试,MAE分别达到了64.884、8.958、95.523、209.660,MSE分别达到了104.411、16.202、173.453、282.217。结果表明,提出的GLCrowd网络模型在密集场景下的人群计数中具有较好的性能。 展开更多
关键词 人群计数 Vision Transformer 全局-局部注意力 弱监督学习
在线阅读 下载PDF
基于全局-局部特征和自适应注意力机制的图像语义描述算法 被引量:6
5
作者 赵小虎 尹良飞 赵成龙 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第1期126-134,共9页
为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对... 为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对图像的关注点,对图像细节的描述更加完善;在解码时加入注意力机制对图像特征加权输入,可以自适应选择当前时刻输出的文本单词对视觉信息与语义信息的依赖权重,有效地提高对图像语义描述的性能.实验结果表明,该方法相对于其他语义描述算法效果更有竞争力,可以更准确、更细致地识别图片中的物体,对输入图像进行更全面地描述;对于微小的物体的识别准确率更高. 展开更多
关键词 图像语义描述 图像关注点 高层语义信息 描述句子细节 全局-局部特征提取 自适应注意力机制
在线阅读 下载PDF
局部注意力引导下的全局池化残差分类网络 被引量:3
6
作者 姜文涛 董睿 张晟翀 《光电工程》 CAS CSCD 北大核心 2024年第7期107-124,共18页
大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其... 大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其次提出多分割局部增强注意力机制(MSLE)模块,MSLE模块将图像整体分割成多个小图像,增强每个小图像的局部特征,通过特征组交互的方式将局部重要特征引导到全局特征中;最后提出池化残差(PR)模块来处理ResNet残差结构丢失信息的问题,提高各层之间的信息利用率。实验结果表明,MSLENet通过增强局部特征的关联性,在多个数据集上均有良好的效果,有效地提高了网络的表达能力。 展开更多
关键词 图像分类 注意力机制 残差结构 局部特征 全局特征 关联性
在线阅读 下载PDF
基于注意力机制与残差结构的联合调制识别
7
作者 郑向阳 王忠勇 +3 位作者 杨晨旭 陈家伟 巩克现 王玮 《计算机应用与软件》 北大核心 2025年第10期163-170,共8页
针对多种信号调制类型识别,提出一种信号调制类型联合结构识别分类器,对接收信号二值化分类并分别输入两种网络进行自动识别。在高信噪比区间,利用深度可分离卷积引入跳跃连接方法叠加残差结构,同时添加多头自注意力机制代替部分卷积,... 针对多种信号调制类型识别,提出一种信号调制类型联合结构识别分类器,对接收信号二值化分类并分别输入两种网络进行自动识别。在高信噪比区间,利用深度可分离卷积引入跳跃连接方法叠加残差结构,同时添加多头自注意力机制代替部分卷积,获得优于以上两种机制的性能;在低信噪比区间,利用Transformer的自注意力机制判断输入序列不同区域的重要性,提取更加有效的特征信息。通过公开数据集的数据实验,验证了联合结构的识别有效性,低信噪比区间的识别准确率得到显著提高,高信噪比区间识别率得到进一步提升的同时,验证得到所提算法具有相对较低的复杂度。 展开更多
关键词 自动调制分类 卷积神经网络 多头注意力机制 深度可分离卷积 全局深度卷积
在线阅读 下载PDF
融合多特征与全局-局部Transformer的图像修复算法 被引量:1
8
作者 滕诗宇 何丽君 《电子测量技术》 北大核心 2025年第6期121-129,共9页
针对当前图像修复领域所面临的高计算复杂度以及在生成结构合理且细节丰富的图像方面的局限,提出了一种融合多尺度分层特征与全局-局部协同Transformer的图像修复模型。首先提出多尺度分层特征融合模块,以实现深层特征与浅层特征细节上... 针对当前图像修复领域所面临的高计算复杂度以及在生成结构合理且细节丰富的图像方面的局限,提出了一种融合多尺度分层特征与全局-局部协同Transformer的图像修复模型。首先提出多尺度分层特征融合模块,以实现深层特征与浅层特征细节上的有效融合,在扩大感受野的同时减少关键信息丢失情况。其次提出用于全局推理的全局-局部协同Transformer模块,它通过集成矩形窗口注意力机制和局部前馈神经网络,在降低计算复杂度的同时,提高模型对全局上下文信息的宏观理解和对局部细节特征的微观捕捉能力,增强图像的整体一致性。实验在CelebA-HQ和Places2数据集上进行了验证,在处理40%~50%掩码时,所提方法与常用的修复方法对比,PSNR平均提高了0.26~6.25 dB,SSIM平均提升了1.4%~19%,L1平均下降了0.2%~5.66%。实验证明,所提方法修复后的图像在视觉上具有更加真实和自然的效果,进一步验证了该方法的有效性。 展开更多
关键词 深度学习 图像修复 多尺度分层特征融合 全局-局部协同Transformer 矩形窗口注意力机制 局部前馈神经网络
在线阅读 下载PDF
基于全局注意力的Gam-EEGNet在SSVEP分类中的应用 被引量:2
9
作者 刘俊杰 谢俊 +1 位作者 王虎 胡博 《电子测量技术》 北大核心 2024年第22期76-83,共8页
稳态视觉诱发电位(SSVEP)作为脑机接口(BCI)系统中的重要信号类型,因其高稳定性和易操作性而广泛应用于BCI研究。在过去的研究中,已有许多方法在SSVEP信号分类中取得了显著进展,但依然面临着信噪比低、信号非平稳性和个体差异大的挑战... 稳态视觉诱发电位(SSVEP)作为脑机接口(BCI)系统中的重要信号类型,因其高稳定性和易操作性而广泛应用于BCI研究。在过去的研究中,已有许多方法在SSVEP信号分类中取得了显著进展,但依然面临着信噪比低、信号非平稳性和个体差异大的挑战。为进一步提升SSVEP分类的准确性和实用性,本文提出了一种结合全局注意力机制与紧凑脑电网络(EEGNet)的新型神经网络架构——Gam-EEGNet。EEGNet作为一种紧凑、高效且适应性强的基础模型,在SSVEP信号处理中具有重要作用。通过在EEGNet中引入全局注意力机制,Gam-EEGNet能够更精确地提取和表征SSVEP信号特征,从而有效降低个体差异和噪声的影响。实验采用了涵盖12种不同频率的SSVEP脑电数据,并将Gam-EEGNet与典型卷积神经网络(CCNN)、滤波器组-时间卷积神经网络(FB-tCNN)和滤波器组-时间卷积神经网络(SSVEPNet)等主流深度学习方法进行了分类性能对比。结果表明,Gam-EEGNet在不同时间窗口下的分类准确率和信息传输率(ITR)均优于其他方法,特别是在0.7 s的短时间窗口内,分类精度达到86.58%;在1 s时间窗内,多名被试者的平均识别准确率超过95%,ITR超过189 bits/min。此外,Gam-EEGNet在训练过程中表现出更好的收敛性和稳定性,具有更快的收敛速度和更低的训练误差。这些结果表明,Gam-EEGNet在SSVEP信号分类中展现出显著的性能提升,尤其适用于实时BCI系统中的快速响应场景,具有广泛的应用潜力。 展开更多
关键词 深度学习 -机接口 稳态视觉诱发电位 全局注意力机制 Gam-EEGNet模型
在线阅读 下载PDF
结合全局-局部特征和注意力的图像描述方法 被引量:2
10
作者 谢琦彬 陈平华 《计算机工程与应用》 CSCD 北大核心 2022年第12期218-225,共8页
为了进一步提高图像描述生成文本的精度,提出一种结合全局-局部特征和注意力机制的图像描述方法。该方法在传统的编码器-解码器模型上进行改进,从整体角度来看,编码器阶段使用残差网络ResNet101提取图像的全局特征和局部特征,以避免对... 为了进一步提高图像描述生成文本的精度,提出一种结合全局-局部特征和注意力机制的图像描述方法。该方法在传统的编码器-解码器模型上进行改进,从整体角度来看,编码器阶段使用残差网络ResNet101提取图像的全局特征和局部特征,以避免对象丢失或对象预测错误问题,在解码器阶段采用嵌入改进后的注意力机制的双向GRU生成文本序列。从局部角度来看,该模型提出的注意力机制是一种独立的循环结构,通过计算图像局部特征向量与语义向量之间的相似度来获取注意力权重,增强图像特征与语义信息之间的映射。在MSCOCO数据集上的实验结果显示,该算法在BLEU、CIDEr、METEOR等评价指标上均获得了不同程度的提升,表明使用该模型生成的描述文本准确度高且细节丰富。 展开更多
关键词 图像描述 注意力机制 编码器-解码器框架 全局特征 局部特征
在线阅读 下载PDF
局部-全局特征引导的图文多级关系分析与挖掘方法
11
作者 王海荣 郭瑞萍 +1 位作者 徐玺 周北京 《燕山大学学报》 CAS 北大核心 2024年第5期446-455,共10页
具有语义相关性的文本、图像数据往往具有互补性,可以从不同角度增强语义理解,因此,图文语义关系挖掘是图文数据得以充分利用的关键。为解决图文数据深层语义关系挖掘不充分、检索阶段预测不精准的问题,本文提出了一种局部-全局特征引... 具有语义相关性的文本、图像数据往往具有互补性,可以从不同角度增强语义理解,因此,图文语义关系挖掘是图文数据得以充分利用的关键。为解决图文数据深层语义关系挖掘不充分、检索阶段预测不精准的问题,本文提出了一种局部-全局特征引导的多级关系分析与挖掘方法。采用多头自注意力机制的Transformer建模图像关系,构建图像引导的文本注意力模块,挖掘图像区域和全局文本间的细粒度关系,融合局部-全局特征有效增强图文数据的语义关系。为验证本文方法,在Flickr30K、MSCOCO-1K和MSCOCO-3K数据集上进行实验,并与VSM、SGRAF等13种方法进行对比分析,本文方法中以文索图的召回率平均提升了0.62%,以图索文的召回率平均提高了0.5%,实验结果验证了本文方法的有效性。 展开更多
关键词 图文关系挖掘 多头注意力机制 局部-全局特征
在线阅读 下载PDF
利用全局与局部帧级特征进行基于共享注意力的视频问答 被引量:1
12
作者 王雷全 候文艳 +3 位作者 袁韶祖 赵欣 林瑶 吴春雷 《计算机科学》 CSCD 北大核心 2021年第8期145-149,共5页
视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获... 视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获得高质量的答案。文中提出了一个通过利用局部和全局帧级别的视觉信息来进行视频问答的多共享注意力网络。具体来说,以不同帧率提取视频帧,并以此提取帧级的全局与局部视觉特征,这两种特征包含了多个帧级别特征,用于对视频时间动态建模,再以共享注意力的形式建模全局与局部视觉特征的相关性,然后结合文本问题来推断答案。在天池视频问答数据集上进行了大量的实验,验证了所提方法的有效性。 展开更多
关键词 视频问答 共享注意力机制 全局局部帧级特征
在线阅读 下载PDF
基于全局与局部特征加权融合的隐喻识别模型
13
作者 马月坤 马铭佑 《计算机工程》 北大核心 2025年第5期143-153,共11页
部分文本中隐喻本体与喻体位置相距较远,导致模型学习文本语境信息的难度增大,以及所提取的特征中重要信息不明显。为此,提出一种基于全局与局部特征加权融合的隐喻识别模型。首先,设计了局部特征提取模块(LFEM),通过对不同范围以及更... 部分文本中隐喻本体与喻体位置相距较远,导致模型学习文本语境信息的难度增大,以及所提取的特征中重要信息不明显。为此,提出一种基于全局与局部特征加权融合的隐喻识别模型。首先,设计了局部特征提取模块(LFEM),通过对不同范围以及更大感受野下文本局部特征的关注来达到学习词语周围不同距离语境信息的目的;其次,使用双向长短时记忆(BiLSTM)与多头注意力构成全局特征提取模块(GFEM),学习宏观句子级语义信息;最后,设计了特征加权融合模块(FWFM),对提取得到的2种特征进行自适应动态融合,以较少的噪声获得鲁棒性更强且重要信息更为集中的特征。实验结果表明,相比RoBERTa+Transformer+GCN模型,所提模型在VUA ALLPOS、TOEFL ALLPOS以及CCL 3个数据集上的F1值分别提升了1.1、1.2和3.2百分点,所提模型具有更高的隐喻识别精度。 展开更多
关键词 隐喻识别 全局特征 局部特征 特征加权 注意力机制 双向长短时记忆
在线阅读 下载PDF
融合局部和全局相关性的多变量时间序列预测方法
14
作者 王翔 陈志祥 毛国君 《计算机应用》 北大核心 2025年第9期2806-2816,共11页
为解决现有时间序列模型未能充分融合局部和全局依赖的问题,提出一种融合局部和全局相关性的多变量时间序列预测方法PatchLG(Patch-integrated Local-Global correlation method)。该方法基于3个关键部分:1)将时间序列划分为多个子序列(... 为解决现有时间序列模型未能充分融合局部和全局依赖的问题,提出一种融合局部和全局相关性的多变量时间序列预测方法PatchLG(Patch-integrated Local-Global correlation method)。该方法基于3个关键部分:1)将时间序列划分为多个子序列(Patch),在保持时间序列的局部性的同时使模型更易于提取全局依赖;2)使用深度可分离卷积和自注意力机制建模局部和全局相关性;3)将时间序列分解为趋势项与季节项2个部分同时进行预测,并将预测结果组合起来得到最终预测结果。在7个基准数据集上的实验结果表明,PatchLG相较于最优基线方法PatchTST(Patch Time Series Transformer)在均方误差(MSE)和平均绝对误差(MAE)2个指标上平均改进量为3.0%和2.9%,同时具有较短的实际运行时间和较低的内存消耗,验证了PatchLG在时间序列预测中的有效性。 展开更多
关键词 时间序列 多变量时间序列预测 深度可分离卷积 注意力机制 局部全局依赖
在线阅读 下载PDF
全局-局部特征融合的人体姿态估计算法
15
作者 毛琳 任春贺 杨大伟 《电子测量技术》 北大核心 2024年第10期115-125,共11页
针对现有人体姿态估计算法存在因骨干网络特征提取不充分,导致关键点特征信息丢失的问题,提出一种结合全局-局部特征融合模块的人体姿态估计网络模型(GLF-Net)。为了在特征提取阶段获得高质量的特征图,该算法从全局特征和局部特征出发,... 针对现有人体姿态估计算法存在因骨干网络特征提取不充分,导致关键点特征信息丢失的问题,提出一种结合全局-局部特征融合模块的人体姿态估计网络模型(GLF-Net)。为了在特征提取阶段获得高质量的特征图,该算法从全局特征和局部特征出发,对骨干网络ResNet-50进行改进,分别设计了全局极化自注意力模块和局部深度可分离卷积模块。同时采用并行的结构方式将融合了全局位置信息和局部语义信息特征的模块嵌入到骨干网络的Bottleneck层中,既能增强原骨干网络的特征提取能力,又为后续的Transformer网络提供有效的全局和局部特征输入,进而提高姿态关键点检测的性能。在公开人体姿态估计数据集COCO 2017上和MPII数据集上分别进行模型测试,该算法性能与与基准算法(Poseur)相比,姿态关键点的平均准确度(AP)提升了2.1%,平均召回率(AR)提升了1.5%,正确估计关键点比例(PCKh@0.5)最高达到90.6。实验结果表明,所提算法在姿态估计精度上优于现存同类方法,可以明显提高人体姿态关键点的定位准确度。 展开更多
关键词 人体姿态估计 特征提取 全局极化自注意力 局部深度可分离卷积 全局-局部特征融合
在线阅读 下载PDF
基于局部编码和多头注意力模型的电力系统暂态稳定性评估 被引量:1
16
作者 谷广超 轩克辉 《计算机应用与软件》 北大核心 2023年第8期114-120,共7页
针对当前基于神经网络的暂态稳定性评估方法无法对暂态状态量测数据进行全局建模的问题,提出一种基于局部编码和多头注意力模型的暂态稳定性评估框架。利用局部RNN结构提取“三段式”暂态状态量测数据的局部特征;利用多头注意力模型对... 针对当前基于神经网络的暂态稳定性评估方法无法对暂态状态量测数据进行全局建模的问题,提出一种基于局部编码和多头注意力模型的暂态稳定性评估框架。利用局部RNN结构提取“三段式”暂态状态量测数据的局部特征;利用多头注意力模型对所有局部特征进行建模,计算各局部特征的长距离依赖关系,挖掘之间显著的关联特征表示。将该特征表示输入到全连接神经网络层和softmax层,输出暂态稳定性评估概率。在新英格兰10机39节点系统模拟仿真环境中的实验结果表明该方法切实可行,相较于次优结果,准确率提高3.05%,F1值提高3.04%,误报率降低39.44%。 展开更多
关键词 局部编码 多头注意力模型 全局建模 暂态稳定性
在线阅读 下载PDF
基于三分支对抗学习和补偿注意力的红外和可见光图像融合 被引量:1
17
作者 邸敬 任莉 +2 位作者 刘冀钊 郭文庆 廉敬 《红外技术》 CSCD 北大核心 2024年第5期510-521,共12页
针对现有深度学习图像融合方法依赖卷积提取特征,并未考虑源图像全局特征,融合结果容易产生纹理模糊、对比度低等问题,本文提出一种基于三分支对抗学习和补偿注意力的红外和可见光图像融合方法。首先,生成器网络采用密集块和补偿注意力... 针对现有深度学习图像融合方法依赖卷积提取特征,并未考虑源图像全局特征,融合结果容易产生纹理模糊、对比度低等问题,本文提出一种基于三分支对抗学习和补偿注意力的红外和可见光图像融合方法。首先,生成器网络采用密集块和补偿注意力机制构建局部-全局三分支提取特征信息。然后,利用通道特征和空间特征变化构建补偿注意力机制提取全局信息,更进一步提取红外目标和可见光细节表征。其次,设计聚焦双对抗鉴别器,以确定融合结果和源图像之间的相似分布。最后,选用公开数据集TNO和RoadScene进行实验并与其他9种具有代表性的图像融合方法进行对比,本文提出的方法不仅获得纹理细节更清晰、对比度更好的融合结果,而且客观度量指标优于其他先进方法。 展开更多
关键词 红外可见光图像融合 局部-全局三分支 局部特征提取 补偿注意力机制 对抗学习 聚焦双对抗鉴别器
在线阅读 下载PDF
基于注意力机制和姿态识别的行人再识别 被引量:1
18
作者 赵彦如 牛东杰 杨蕙萌 《河南理工大学学报(自然科学版)》 CAS 北大核心 2023年第2期120-126,共7页
在解决行人再识别技术中的姿态变化、遮挡、背景等问题时,为了提高遮挡下的行人再识别性能,提出一种基于注意力机制和姿态识别的行人再识别方法。采用全局注意网络和姿态识别网络分别提取行人图像的全局特征、关节点位置热力图和对应的... 在解决行人再识别技术中的姿态变化、遮挡、背景等问题时,为了提高遮挡下的行人再识别性能,提出一种基于注意力机制和姿态识别的行人再识别方法。采用全局注意网络和姿态识别网络分别提取行人图像的全局特征、关节点位置热力图和对应的置信度,通过计算得到行人13个关节点和融合所有关节点的局部特征,对全局特征和14个局部特征分别进行行人分类训练,利用多任务学习多个损失共同监督网络的优化。测试时,将关键点特征和全局特征融合后,计算行人的距离排序。在Market1501和DukeMTMC-reID数据集上测试的Rank-1/mAP指标分别达到了85.1%/75.6%和64.3%/55.3%。结果表明,所设计方法具备抗姿态变化、遮挡和背景的能力,同时具有较高的识别能力和识别精度。 展开更多
关键词 深度学习 行人再识别 注意力机制 姿态识别 特征融合 局部特征 全局特征
在线阅读 下载PDF
基于三目注意力机制的高效轻量化麦穗检测算法
19
作者 董燕 刘运东 +2 位作者 李卫杰 刘洲峰 李春雷 《计算机工程与设计》 北大核心 2023年第7期2062-2069,共8页
针对复杂大田环境下基于卷积神经网络的麦穗检测方法实时性差、检测精度低的问题,提出一种基于三目注意力机制的高效轻量化麦穗检测算法。采用MobileNetV3作为主干网络对特征进行高效提取;通过融合通道、空间和位置的特征信息设计三目... 针对复杂大田环境下基于卷积神经网络的麦穗检测方法实时性差、检测精度低的问题,提出一种基于三目注意力机制的高效轻量化麦穗检测算法。采用MobileNetV3作为主干网络对特征进行高效提取;通过融合通道、空间和位置的特征信息设计三目注意力机制,提升模型对关键特征的敏感度;基于条件卷积设计全局多头自注意力机制,增强全局特征的提取能力;选择CIOU作为边框回归损失函数,增强遮挡及重叠目标的检测效果。实验结果表明,与其它优秀的算法相比,所提算法在减少模型容量的同时,提升了检测精度和速度。 展开更多
关键词 复杂场景 麦穗检测 深度学习 轻量化 三目注意力机制 全局多头注意力机制 条件卷积
在线阅读 下载PDF
求解旅行商问题的GCN-Pointransformer模型
20
作者 邱云飞 刘一菲 +1 位作者 于智龙 金海波 《计算机科学与探索》 北大核心 2025年第3期657-666,共10页
由于Transformer模型基于全连接注意力机制,导致在求解经典旅行商问题(TSP)时,计算复杂度较高并且GPU内存使用量过大。针对此问题,提出了一种基于图卷积嵌入层和多头局部自注意力机制的GCN-Pointransformer模型。使用图卷积嵌入方式从... 由于Transformer模型基于全连接注意力机制,导致在求解经典旅行商问题(TSP)时,计算复杂度较高并且GPU内存使用量过大。针对此问题,提出了一种基于图卷积嵌入层和多头局部自注意力机制的GCN-Pointransformer模型。使用图卷积嵌入方式从输入数据中进行空间特征学习,图卷积嵌入层包含多个可以提取输入数据局部特征的卷积核;使用多头局部自注意力机制(MHLSA),删除冗余信息并提取有用的特征;在编码器中使用可逆残差网络,在反向传播过程中只存储输入和输出嵌入特征对;模型在解码器中增加了Pointer指针层,使用注意力权重作为概率分布,确定要访问的下一个节点。在TSP随机数据集上进行对比实验,优化间隙减少12%,GPU内存减少约11%,推理时间减少约25%,结果表明,该方法优于求解TSP的标准Transformer模型。 展开更多
关键词 旅行商问题(TSP) GCN-Pointransformer 多头局部注意力机制(MHLSA) 可逆残差 指针层
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部