期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
面向分割的局部分块与全局多尺度注意力机制
1
作者 谭荆彬 赵旭俊 苏慧娟 《计算机工程与设计》 北大核心 2025年第4期1141-1148,共8页
现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个... 现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个小块,分别计算这些小块的注意力得分,增强对局部信息的感知能力。使用一组空洞卷积计算整个特征图的得分,获得全局多尺度信息的权衡。实验中,将PGMA集成到U-Net、DeepLab、SegNet等语义分割网络中,有效提升了它们的分割性能。这表明PGMA在增强CNN性能方面优于当前主流方法。 展开更多
关键词 卷积神经网络 注意力机制 局部信息 分块策略 细节感知 全局多尺度信息 语义分割
在线阅读 下载PDF
局部注意力引导下的全局池化残差分类网络 被引量:2
2
作者 姜文涛 董睿 张晟翀 《光电工程》 CAS CSCD 北大核心 2024年第7期107-124,共18页
大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其... 大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其次提出多分割局部增强注意力机制(MSLE)模块,MSLE模块将图像整体分割成多个小图像,增强每个小图像的局部特征,通过特征组交互的方式将局部重要特征引导到全局特征中;最后提出池化残差(PR)模块来处理ResNet残差结构丢失信息的问题,提高各层之间的信息利用率。实验结果表明,MSLENet通过增强局部特征的关联性,在多个数据集上均有良好的效果,有效地提高了网络的表达能力。 展开更多
关键词 图像分类 注意力机制 残差结构 局部特征 全局特征 关联性
在线阅读 下载PDF
结合卷积增强窗口注意力的双分支语音增强神经网络
3
作者 张晨辉 原之安 钱宇华 《计算机研究与发展》 北大核心 2025年第4期852-862,共11页
在复杂环境以及突发背景噪音条件下,语音增强任务具有极大的困难和挑战.主要原因是现有的语音增强方法未能有效捕获语谱图特征,尤其是局部信息.在过去的研究中,Transformer模型更专注于音频的全局信息,而忽略了局部信息的重要性.在音频... 在复杂环境以及突发背景噪音条件下,语音增强任务具有极大的困难和挑战.主要原因是现有的语音增强方法未能有效捕获语谱图特征,尤其是局部信息.在过去的研究中,Transformer模型更专注于音频的全局信息,而忽略了局部信息的重要性.在音频经过短时傅里叶变换(STFT)处理后,多数模型仅使用幅值信息,而忽略了相位信息,导致它们未能有效捕获语谱图特征,从而影响了语音增强的效果.基于此设计出一个带有卷积增强窗口注意力的双分支语音增强神经网络.该模型采用U-NET架构,通过双分支结构对音频的幅值和相位信息同时建模;在2个分支之间引入复值计算模块以实现信息交互;在编码器层和解码器层之间的跳跃连接部分采用卷积增强窗口注意力模块,该模块执行基于非重叠窗口的自注意力操作,在捕获局部上下文信息的同时显著降低了语音增强模型的计算复杂度.该模型在公开的Voicebank-Demand数据集上进行测试,与基线模型DCUNET 16和DCUNET20相比,在客观语音质量评估指标PESQ(perceptual evaluation of speech quality)分别提高了0.51和0.47.除了PESQ指标外,其他指标也都有显著的提升.相较于现有的各类语音增强模型,该模型在各项指标上均处于领先水平,尤其是在PESQ得分方面的提升更为显著. 展开更多
关键词 语音增强 分支网络 语谱图特征 卷积增强窗口注意力 全局信息 局部信息
在线阅读 下载PDF
基于局部全局自注意与空间通道稀疏增强的红外船舶目标检测算法研究
4
作者 黎煜培 王忠华 《红外与激光工程》 北大核心 2025年第3期339-351,共13页
针对红外船舶图像检测中存在目标尺度变化大、密集堆叠目标多、小目标细节丢失等问题,提出了一种基于局部全局自注意与空间通道稀疏增强的红外船舶目标检测算法。首先,在YOLOv8s主干网络中融入局部全局自注意力模块,以获取更丰富的局部... 针对红外船舶图像检测中存在目标尺度变化大、密集堆叠目标多、小目标细节丢失等问题,提出了一种基于局部全局自注意与空间通道稀疏增强的红外船舶目标检测算法。首先,在YOLOv8s主干网络中融入局部全局自注意力模块,以获取更丰富的局部和全局特征,解决深度特征提取过程中的信息稀释丢失问题,实现细致化聚焦目标特征,增强特征间依赖关系,提高小目标的特征提取能力。其次,在颈部网络中加入空间通道稀疏注意力模块,将分块特征提取与通道稀疏策略深度融合,提升多尺度目标的空间信息捕获能力,重构通道信息,再对特征重标定,强化重要特征信息的影响,增强多尺度特征融合能力。最后,采用引入了递减置信度惩罚因子的Soft-NMS改进NMS,优化堆叠目标与小目标误检漏检的问题。实验结果表明,改进后的YOLOv8s模型相较于基准模型,在mAP0.5和mAP0.5∶0.95评价指标上分别提高了2.1%和4.4%,达到95.7%和72.8%,进一步验证了该算法在提升红外船舶目标检测精度上的有效性。同时,与其他经典模型和最新的YOLOv11模型相比,该算法在检测精度方面具有更好的性能。 展开更多
关键词 YOLOv8s 局部全局注意力 空间通道稀疏注意力 Soft-NMS
在线阅读 下载PDF
整合边缘卷积与全局-局部自注意力的机载点云分类
5
作者 涂静敏 严进 +3 位作者 李礼 姚剑 李婕 康妍斐 《光学精密工程》 CSCD 北大核心 2024年第24期3658-3673,共16页
激光点云分类是实现三维场景理解的基础。针对机载点云大场景分类中存在的特征表达不足、样本类别不均衡的问题,本文提出一种整合边缘卷积与全局-局部自注意力的机载点云分类方法。首先,以U-net为网络框架,融合Point Transformer与边缘... 激光点云分类是实现三维场景理解的基础。针对机载点云大场景分类中存在的特征表达不足、样本类别不均衡的问题,本文提出一种整合边缘卷积与全局-局部自注意力的机载点云分类方法。首先,以U-net为网络框架,融合Point Transformer与边缘卷积模块,使得模型能够关注到复杂地物边界和纹理信息,获得表达能力更好的局部几何特征。其次,创新性地提出一种融合全局上下文信息和局部结构特征的自注意力机制,全局自注意力模块倾向于整个输入序列的信息,而局部自注意力模块则更注重于局部区域的细节。两种机制结合增强了对长距离依赖关系和局部结构的捕捉,同时使得模型能够兼顾少数类别的关键特征,在一定程度上降低样本类别不均衡对分类精度的影响,有助于提高模型对复杂地物关系的分类能力。最后,在公开的ISPRS-3D数据集和WHU-Urban3D数据集上对本文所提出的方法进行验证,实验结果表明,该方法在两个数据集上的分类精度分别为82.5%和87.4%,优于PointNet++,Stratified Transformer等经典网络及ISPRS 3D官网竞赛网络,可有效提升机载点云分类精度。 展开更多
关键词 机载激光雷达 点云分类 边缘卷积 全局-局部注意力 U-net
在线阅读 下载PDF
GLCrowd:基于全局-局部注意力的弱监督密集场景人群计数模型 被引量:1
6
作者 张红民 田钱前 +1 位作者 颜鼎鼎 卜令宇 《光电工程》 CAS CSCD 北大核心 2024年第10期75-86,共12页
针对人群计数在密集场景下存在背景复杂、尺度变化大等问题,提出了一种结合全局-局部注意力的弱监督密集场景人群计数模型——GLCrowd。首先,设计了一种结合深度卷积的局部注意力模块,通过上下文权重增强局部特征,同时结合特征权重共享... 针对人群计数在密集场景下存在背景复杂、尺度变化大等问题,提出了一种结合全局-局部注意力的弱监督密集场景人群计数模型——GLCrowd。首先,设计了一种结合深度卷积的局部注意力模块,通过上下文权重增强局部特征,同时结合特征权重共享获得高频局部信息。其次,利用Vision Transformer(ViT)的自注意力机制捕获低频全局信息。最后,将全局与局部注意力有效融合,并通过回归令牌来完成计数。在Shanghai Tech PartA、Shanghai Tech PartB、UCF-QNRF以及UCF_CC_50数据集上进行了模型测试,MAE分别达到了64.884、8.958、95.523、209.660,MSE分别达到了104.411、16.202、173.453、282.217。结果表明,提出的GLCrowd网络模型在密集场景下的人群计数中具有较好的性能。 展开更多
关键词 人群计数 Vision Transformer 全局-局部注意力 弱监督学习
在线阅读 下载PDF
融合全局选择与局部区分的车辆重识别网络
7
作者 徐胜军 张梦倩 +2 位作者 詹博涵 刘光辉 孟月波 《系统仿真学报》 北大核心 2025年第1期220-233,共14页
针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆... 针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆的整体外观信息,局部分支捕获车辆的差异性细节信息。基于注意力机制提出了上下文特征选择模块(context feature selection module,CFSM),有效分离了车辆信息与复杂背景信息,并提出了一种细节特征增强模块(detail feature enhancement module,DFEM),利用部件之间的相对位置信息强化多粒度特征细节信息的学习。提出了一种权值自适应平衡策略,联合多损失函数进行训练。实验结果表明,所提网络在VeRi-776数据集上的mAP、CMC@1和CMC@5分别达到73.2%、93.4%和97.3%;在VehicleID数据集的大规模测试子集上,CMC@1和CMC@5分别达到75.0%和92.7%。与对比网络相比,所提网络具有较高的识别率和鲁棒性。 展开更多
关键词 车辆重识别 多分支结构 全局上下文特征 局部区分特征 权值自适应策略
在线阅读 下载PDF
基于三分支对抗学习和补偿注意力的红外和可见光图像融合 被引量:1
8
作者 邸敬 任莉 +2 位作者 刘冀钊 郭文庆 廉敬 《红外技术》 CSCD 北大核心 2024年第5期510-521,共12页
针对现有深度学习图像融合方法依赖卷积提取特征,并未考虑源图像全局特征,融合结果容易产生纹理模糊、对比度低等问题,本文提出一种基于三分支对抗学习和补偿注意力的红外和可见光图像融合方法。首先,生成器网络采用密集块和补偿注意力... 针对现有深度学习图像融合方法依赖卷积提取特征,并未考虑源图像全局特征,融合结果容易产生纹理模糊、对比度低等问题,本文提出一种基于三分支对抗学习和补偿注意力的红外和可见光图像融合方法。首先,生成器网络采用密集块和补偿注意力机制构建局部-全局三分支提取特征信息。然后,利用通道特征和空间特征变化构建补偿注意力机制提取全局信息,更进一步提取红外目标和可见光细节表征。其次,设计聚焦双对抗鉴别器,以确定融合结果和源图像之间的相似分布。最后,选用公开数据集TNO和RoadScene进行实验并与其他9种具有代表性的图像融合方法进行对比,本文提出的方法不仅获得纹理细节更清晰、对比度更好的融合结果,而且客观度量指标优于其他先进方法。 展开更多
关键词 红外可见光图像融合 局部-全局分支 局部特征提取 补偿注意力机制 对抗学习 聚焦双对抗鉴别器
在线阅读 下载PDF
双注意力随机选择全局上下文细粒度识别网络
9
作者 徐胜军 荆扬 +3 位作者 段中兴 李明海 李海涛 刘福友 《液晶与显示》 CAS CSCD 北大核心 2024年第4期506-521,共16页
针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空... 针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空间随机选择,使网络能够关注到其他潜在微小判别性特征;其次,利用全局上下文注意力模块将深层特征的语义信息融合到中间层,增强中间层定位微小特征的能力;最后,提出一种多分支损失,对中间层、深层和拼接层特征引入分类损失,结合不同分支提取到的特征,诱导网络获得多样性的判别特征。所提网络在Stanford-cars、CUB-200-2011、FGVC-Aircraft 3个公开细粒度数据集和真实场景下车型数据集VMRURS上分别达到了95.2%、92.1%、94.0%和97.0%的识别准确率,其性能相比其他对比方法有较大幅度提升。 展开更多
关键词 细粒度识别 ConvNeXt 注意力随机选择 全局上下文注意力 多分支损失
在线阅读 下载PDF
联合注意力机制和多分支特征的行人重识别
10
作者 任丹萍 董会升 何婷婷 《计算机工程与设计》 北大核心 2024年第8期2520-2526,共7页
针对行人重识别技术中存在模型识别率低的问题,提出一个联合注意力机制和多分支特征的网络模型。在残差网络中嵌入自注意力机制模块强化图像有效特征的提取,在深度特征挖掘模块,使用全局特征分支、局部关联特征分支以及随机擦除特征分... 针对行人重识别技术中存在模型识别率低的问题,提出一个联合注意力机制和多分支特征的网络模型。在残差网络中嵌入自注意力机制模块强化图像有效特征的提取,在深度特征挖掘模块,使用全局特征分支、局部关联特征分支以及随机擦除特征分支形成对行人更全面的描述。在优化过程中提出联合余弦交叉熵损失、全样本三元组损失、中心损失以及特征对齐损失对网络使用最小最大策略进行更新。所提方法在Market-1501和DukeMTMC-reID数据集上首位准确率分别达到了95.8%和89.8%。 展开更多
关键词 行人重识别 深度学习 注意力机制 多分支特征 局部特征 随机擦除 三元组损失
在线阅读 下载PDF
融合注意力机制的双路人体姿态估计网络
11
作者 赵一鸣 孙士保 +2 位作者 石念峰 王国强 王喜龙 《计算机工程与设计》 北大核心 2025年第8期2297-2304,共8页
针对基于Transformer的人体姿态估计算法局部特征提取能力不足,且在热图转换过程中产生量化误差导致关键点预测精度低的问题,提出一种融合注意力机制的双路人体姿态估计方法。设计了双路CNN-Transformer模块(CT模块),同时捕获人体姿态... 针对基于Transformer的人体姿态估计算法局部特征提取能力不足,且在热图转换过程中产生量化误差导致关键点预测精度低的问题,提出一种融合注意力机制的双路人体姿态估计方法。设计了双路CNN-Transformer模块(CT模块),同时捕获人体姿态的局部特征和全局表征,提高模型的特征表达能力;构建多谱特征多样性模块,通过学习不同频率的分量增强卷积,提取有效的人体姿态局部特征信息;采用无偏数据处理消除人体关键点在热图编码过程中产生的量化误差。实验结果表明,与SimpleBaseline相比,所提方法在降低模型复杂度和计算量的同时,在COCO和MPII数据集上将平均精度分别提升了2.7和0.7个百分点。 展开更多
关键词 人体姿态估计 卷积神经网络 TRANSFORMER 多谱注意力 局部特征 全局依赖性 热图编码
在线阅读 下载PDF
利用全局与局部帧级特征进行基于共享注意力的视频问答 被引量:1
12
作者 王雷全 候文艳 +3 位作者 袁韶祖 赵欣 林瑶 吴春雷 《计算机科学》 CSCD 北大核心 2021年第8期145-149,共5页
视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获... 视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获得高质量的答案。文中提出了一个通过利用局部和全局帧级别的视觉信息来进行视频问答的多共享注意力网络。具体来说,以不同帧率提取视频帧,并以此提取帧级的全局与局部视觉特征,这两种特征包含了多个帧级别特征,用于对视频时间动态建模,再以共享注意力的形式建模全局与局部视觉特征的相关性,然后结合文本问题来推断答案。在天池视频问答数据集上进行了大量的实验,验证了所提方法的有效性。 展开更多
关键词 视频问答 共享注意力机制 全局局部帧级特征
在线阅读 下载PDF
基于Transformer的全局-局部融合特征的遮挡行人重识别方法
13
作者 汪旭 胡晓光 +1 位作者 付哲宇 赵利欣 《计算机科学与探索》 北大核心 2025年第7期1832-1850,共19页
行人重识别(ReID)是利用人工智能解决车站安检、城市监控系统等公共安全应用问题的技术,具有从跨设备采集的图像中识别某一特定行人的能力。但是在行人重识别等问题中,往往会出现行人被刻意遮挡或被复杂场景环境遮挡等因素,这大大增加... 行人重识别(ReID)是利用人工智能解决车站安检、城市监控系统等公共安全应用问题的技术,具有从跨设备采集的图像中识别某一特定行人的能力。但是在行人重识别等问题中,往往会出现行人被刻意遮挡或被复杂场景环境遮挡等因素,这大大增加了行人重识别的难度。在目前所提出的大部分遮挡行人重识别方法中,卷积神经网络模型更加关注局部特征,但难以获得全局结构信息,Transformer网络模型建模长距离的特征依赖,但易忽略局部特征细节。为解决这些难题,提出了一种全局-局部融合特征的遮挡行人重识别方法,利用CNN和Transformer特征学习网络的特点,在丰富行人局部特征的同时提升特征的全局表达能力。该模型由三个部分组成:CNN网络主要提取局部细节特征,Transformer分支侧重提取全局特征信息,并通过跨维度多尺度池化融合模块计算上述两个分支特征的相关性,进而实现全局-局部的特征融合;由多层级注意力引导生成的掩码模块能够精准地突出行人图像中的关键特征,自动对齐行人特征信息,抑制遮挡部分或背景噪声的干扰;图像高低频特征增强模块强化被遮挡行人的高低频特征信息,突出有效信息。消融实验以及在相关数据集上的实验结果证明了所提方法的有效性。 展开更多
关键词 全局 局部 跨维度多尺度池化融合 多层级注意力 高低频特征
在线阅读 下载PDF
基于全局-局部特征和自适应注意力机制的图像语义描述算法 被引量:6
14
作者 赵小虎 尹良飞 赵成龙 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第1期126-134,共9页
为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对... 为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对图像的关注点,对图像细节的描述更加完善;在解码时加入注意力机制对图像特征加权输入,可以自适应选择当前时刻输出的文本单词对视觉信息与语义信息的依赖权重,有效地提高对图像语义描述的性能.实验结果表明,该方法相对于其他语义描述算法效果更有竞争力,可以更准确、更细致地识别图片中的物体,对输入图像进行更全面地描述;对于微小的物体的识别准确率更高. 展开更多
关键词 图像语义描述 图像关注点 高层语义信息 描述句子细节 全局-局部特征提取 自适应注意力机制
在线阅读 下载PDF
基于全局与局部特征加权融合的隐喻识别模型
15
作者 马月坤 马铭佑 《计算机工程》 北大核心 2025年第5期143-153,共11页
部分文本中隐喻本体与喻体位置相距较远,导致模型学习文本语境信息的难度增大,以及所提取的特征中重要信息不明显。为此,提出一种基于全局与局部特征加权融合的隐喻识别模型。首先,设计了局部特征提取模块(LFEM),通过对不同范围以及更... 部分文本中隐喻本体与喻体位置相距较远,导致模型学习文本语境信息的难度增大,以及所提取的特征中重要信息不明显。为此,提出一种基于全局与局部特征加权融合的隐喻识别模型。首先,设计了局部特征提取模块(LFEM),通过对不同范围以及更大感受野下文本局部特征的关注来达到学习词语周围不同距离语境信息的目的;其次,使用双向长短时记忆(BiLSTM)与多头注意力构成全局特征提取模块(GFEM),学习宏观句子级语义信息;最后,设计了特征加权融合模块(FWFM),对提取得到的2种特征进行自适应动态融合,以较少的噪声获得鲁棒性更强且重要信息更为集中的特征。实验结果表明,相比RoBERTa+Transformer+GCN模型,所提模型在VUA ALLPOS、TOEFL ALLPOS以及CCL 3个数据集上的F1值分别提升了1.1、1.2和3.2百分点,所提模型具有更高的隐喻识别精度。 展开更多
关键词 隐喻识别 全局特征 局部特征 特征加权 注意力机制 双向长短时记忆
在线阅读 下载PDF
融合多特征与全局-局部Transformer的图像修复算法
16
作者 滕诗宇 何丽君 《电子测量技术》 北大核心 2025年第6期121-129,共9页
针对当前图像修复领域所面临的高计算复杂度以及在生成结构合理且细节丰富的图像方面的局限,提出了一种融合多尺度分层特征与全局-局部协同Transformer的图像修复模型。首先提出多尺度分层特征融合模块,以实现深层特征与浅层特征细节上... 针对当前图像修复领域所面临的高计算复杂度以及在生成结构合理且细节丰富的图像方面的局限,提出了一种融合多尺度分层特征与全局-局部协同Transformer的图像修复模型。首先提出多尺度分层特征融合模块,以实现深层特征与浅层特征细节上的有效融合,在扩大感受野的同时减少关键信息丢失情况。其次提出用于全局推理的全局-局部协同Transformer模块,它通过集成矩形窗口注意力机制和局部前馈神经网络,在降低计算复杂度的同时,提高模型对全局上下文信息的宏观理解和对局部细节特征的微观捕捉能力,增强图像的整体一致性。实验在CelebA-HQ和Places2数据集上进行了验证,在处理40%~50%掩码时,所提方法与常用的修复方法对比,PSNR平均提高了0.26~6.25 dB,SSIM平均提升了1.4%~19%,L1平均下降了0.2%~5.66%。实验证明,所提方法修复后的图像在视觉上具有更加真实和自然的效果,进一步验证了该方法的有效性。 展开更多
关键词 深度学习 图像修复 多尺度分层特征融合 全局-局部协同Transformer 矩形窗口注意力机制 局部前馈神经网络
在线阅读 下载PDF
语义引导的全局-局部图神经网络的关系抽取
17
作者 任楚岚 刘长胜 +1 位作者 邹绍强 井立志 《计算机工程与设计》 北大核心 2025年第3期705-711,共7页
为解决实体间距离过长导致关系抽取性能不佳的问题,提出一种基于上下文语义引导的全局-局部图神经网络的关系抽取方法。通过注意力增强神经网络集中不同时间步的单词的重要性和相关性,获取上下文语义引导的信息;构建全局-局部图神经网... 为解决实体间距离过长导致关系抽取性能不佳的问题,提出一种基于上下文语义引导的全局-局部图神经网络的关系抽取方法。通过注意力增强神经网络集中不同时间步的单词的重要性和相关性,获取上下文语义引导的信息;构建全局-局部图神经网络增强全局结构和局部实体之间的交互,通过改进的APPNP(approximate personalized propagation of neural predications)算法增强全局依赖关系;融合两个模块进行关系抽取。在NYT数据集上的实验结果表明,F1达到83.7%,较目前主流方法更具优势,验证了模型的有效性。 展开更多
关键词 关系抽取 上下文语义 注意力增强神经网络 图神经网络 全局结构 局部实体 长距离
在线阅读 下载PDF
从全局到局部:双注意力融合去雾网络 被引量:2
18
作者 杨瑷玮 王华珂 侯兴松 《西安交通大学学报》 EI CAS CSCD 北大核心 2023年第7期191-200,共10页
为了处理现有的基于卷积神经网络去雾方法只使用单一的注意力、很难生成细节生动的清晰图像,且容易导致色彩失真的问题,提出了一个全局与局部注意力融合的图像去雾方法,以获得正常清晰度和无色彩失真的去雾图像。首先利用通道注意力将... 为了处理现有的基于卷积神经网络去雾方法只使用单一的注意力、很难生成细节生动的清晰图像,且容易导致色彩失真的问题,提出了一个全局与局部注意力融合的图像去雾方法,以获得正常清晰度和无色彩失真的去雾图像。首先利用通道注意力将输入的有雾图像在通道维度切分为两部分,一部分送入通道像素注意力通道抽取局部特征,另一部分送入Transformer通道学习全局特征,然后利用像素注意力对两个通道学习的特征进行融合,将上述模块作为基本单元组合为一个多级U型去雾网络,增加残差连接缓解上下采样导致的细节信息丢失,最后在网络底层加入一个Transformer模块学习全局信息。在多个公开可用的去雾图像数据集RESIDE SOTS Indoor、RESIDE SOTS Outdoor上测试所提方法的有效性,结果表明:对比经典的去雾方法,所提网络生成的图像细节更丰富并且色彩失真最少;在RESIDE SOTS Outdoor数据集上,相比经典的FFA-Net,峰值信噪比提高1.16 dB,相比GridDehazeNet,峰值信噪比提高3.68 dB。提出的全局与局部注意力融合方法能有效地去除雾霾,提升图像的对比度与清晰度,设计的多级U型去雾网络和残差连接结构能够缓解细节丢失,提升去雾效果,获得清晰的图像。 展开更多
关键词 图像去雾 全局局部注意力融合 通道像素注意力 Transformer模块
在线阅读 下载PDF
结合全局-局部特征和注意力的图像描述方法 被引量:2
19
作者 谢琦彬 陈平华 《计算机工程与应用》 CSCD 北大核心 2022年第12期218-225,共8页
为了进一步提高图像描述生成文本的精度,提出一种结合全局-局部特征和注意力机制的图像描述方法。该方法在传统的编码器-解码器模型上进行改进,从整体角度来看,编码器阶段使用残差网络ResNet101提取图像的全局特征和局部特征,以避免对... 为了进一步提高图像描述生成文本的精度,提出一种结合全局-局部特征和注意力机制的图像描述方法。该方法在传统的编码器-解码器模型上进行改进,从整体角度来看,编码器阶段使用残差网络ResNet101提取图像的全局特征和局部特征,以避免对象丢失或对象预测错误问题,在解码器阶段采用嵌入改进后的注意力机制的双向GRU生成文本序列。从局部角度来看,该模型提出的注意力机制是一种独立的循环结构,通过计算图像局部特征向量与语义向量之间的相似度来获取注意力权重,增强图像特征与语义信息之间的映射。在MSCOCO数据集上的实验结果显示,该算法在BLEU、CIDEr、METEOR等评价指标上均获得了不同程度的提升,表明使用该模型生成的描述文本准确度高且细节丰富。 展开更多
关键词 图像描述 注意力机制 编码器-解码器框架 全局特征 局部特征
在线阅读 下载PDF
基于跨模态交叉注意力网络的多模态情感分析方法 被引量:4
20
作者 王旭阳 王常瑞 +1 位作者 张金峰 邢梦怡 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期84-93,共10页
挖掘不同模态内信息和模态间信息有助于提升多模态情感分析的性能,本文为此提出一种基于跨模态交叉注意力网络的多模态情感分析方法。首先,利用VGG-16网络将多模态数据映射到全局特征空间;同时,利用Swin Transformer网络将多模态数据映... 挖掘不同模态内信息和模态间信息有助于提升多模态情感分析的性能,本文为此提出一种基于跨模态交叉注意力网络的多模态情感分析方法。首先,利用VGG-16网络将多模态数据映射到全局特征空间;同时,利用Swin Transformer网络将多模态数据映射到局部特征空间;其次,构造模态内自注意力和模态间交叉注意力特征;然后,设计一种跨模态交叉注意力融合模块实现不同模态内和模态间特征的深度融合,提升多模态特征表达的可靠性;最后,通过Softmax获得最终预测结果。在2个开源数据集CMU-MOSI和CMU-MSOEI上进行测试,本文模型在七分类任务上获得45.9%和54.1%的准确率,相比当前MCGMF模型,提升了0.66%和2.46%,综合性能提升显著。 展开更多
关键词 情感分析 多模态 跨模态交叉注意力 注意力 局部全局特征
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部