期刊文献+
共找到216篇文章
< 1 2 11 >
每页显示 20 50 100
上下文协同与混合注意力机制驱动的图像去雾算法
1
作者 赵志强 何进良 《计算机应用研究》 北大核心 2025年第9期2875-2880,共6页
现有的去雾模型在处理雾霾图像时,常因雾霾在不同像素和局部区域的分布不均匀,导致特征提取不充分,进而削弱了对图像纹理和边缘信息的捕捉,影响去雾效果。针对这一问题,提出了一种全新的多域注意力机制与上下文协同的图像去雾方法——HA... 现有的去雾模型在处理雾霾图像时,常因雾霾在不同像素和局部区域的分布不均匀,导致特征提取不充分,进而削弱了对图像纹理和边缘信息的捕捉,影响去雾效果。针对这一问题,提出了一种全新的多域注意力机制与上下文协同的图像去雾方法——HACNet。HACNet创新性地提出了以多域注意力机制(MDA)为基础的混合注意力融合算法(HAF)用于整合局部和全局特征,实现了特征的精细化处理与自适应权重分配。同时提出了上下文自适应感知网络(CAF)协同多尺度膨胀卷积(CAAC),增强了模型对多尺度特征的感知能力,能有效应对雾霾浓度的区域差异。实验结果表明,HACNet在RESIDE、NH-Haze和Dense-Haze等数据集上均优于目前的先进去雾模型。HACNet通过多尺度雾霾特征捕捉与局部-全局细节的平衡,有效提高了去雾性能,具有较强的应用潜力。源代码发布在https://github.com/ruicys/HACNet。 展开更多
关键词 图像去雾 注意力机制 上下文协同 特征提取
在线阅读 下载PDF
融合全局上下文注意力的遥感图像检测方法 被引量:1
2
作者 廖欢 朱文球 +1 位作者 雷源毅 徐轲 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第2期278-283,共6页
针对遥感图像场景复杂、目标尺寸不一、且小尺寸目标过多导致的检测精度不佳和出现漏检等问题,提出了一种融合全局上下文注意力的目标检测算法。该算法提出一种全局上下文注意力机制和YOLOv5中C3结构融合的模块,以提升网络捕捉图像全局... 针对遥感图像场景复杂、目标尺寸不一、且小尺寸目标过多导致的检测精度不佳和出现漏检等问题,提出了一种融合全局上下文注意力的目标检测算法。该算法提出一种全局上下文注意力机制和YOLOv5中C3结构融合的模块,以提升网络捕捉图像全局特征的能力;通过Varifocal Loss损失函数来提升对密集、尺寸小的目标的检测性能;采用基于归一化的注意力模块,降低图像中不太显著的特征和权重,使网络能够达到更高的检测准确率;利用动态卷积学习各个维度的信息,让训练得到的模型在降低GFLOPs情况下,同时保持检测精度提升。在NWPU VHR-10数据集上实验结果mAP为96.0%、准确率为98.2%、召回率为94.9%,较原YOLOv5模型分别提升了1.8%、4.7%和2.2%,证明了所改进YOLOv5方法的有效性。 展开更多
关键词 YOLOv5 遥感图像 Varifocal Loss 全局上下文注意力机制 动态卷积
在线阅读 下载PDF
基于多尺度上下文注意力的遥感图像语义分割 被引量:1
3
作者 张剑飞 倪俊文 《科学技术与工程》 北大核心 2025年第8期3333-3339,共7页
遥感图像的语义分割对农业生产、城市规划等领域有十分重要的作用,但受成像距离、光照、地物、环境等因素影响,遥感图像中存在目标语义信息模糊问题,导致在分割时存在不确定性。针对此问题,提出一种多尺度上下文注意力方法(multi-scale ... 遥感图像的语义分割对农业生产、城市规划等领域有十分重要的作用,但受成像距离、光照、地物、环境等因素影响,遥感图像中存在目标语义信息模糊问题,导致在分割时存在不确定性。针对此问题,提出一种多尺度上下文注意力方法(multi-scale context attention,MSCA),其将金字塔池化方法与注意力方法相结合,可以更充分地利用上下文信息。同时该方法显著降低了注意力方法的计算量和内存占用。在ISPRS Potsdam数据集上进行了实验,实验结果表明:MSCA方法在不显著增加内存开销,以及维持推理速度一致的情况下,对遥感图像中语义信息不明确的目标分类,具有更好的分割效果。 展开更多
关键词 遥感图像 语义分割 注意力机制 多尺度上下文
在线阅读 下载PDF
面向分割的局部分块与全局多尺度注意力机制
4
作者 谭荆彬 赵旭俊 苏慧娟 《计算机工程与设计》 北大核心 2025年第4期1141-1148,共8页
现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个... 现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个小块,分别计算这些小块的注意力得分,增强对局部信息的感知能力。使用一组空洞卷积计算整个特征图的得分,获得全局多尺度信息的权衡。实验中,将PGMA集成到U-Net、DeepLab、SegNet等语义分割网络中,有效提升了它们的分割性能。这表明PGMA在增强CNN性能方面优于当前主流方法。 展开更多
关键词 卷积神经网络 注意力机制 局部信息 分块策略 细节感知 全局多尺度信息 语义分割
在线阅读 下载PDF
基于知识图谱与全局上下文注意的图像描述生成模型
5
作者 陶瑞 张素兰 周慧媛 《计算机工程与设计》 北大核心 2025年第5期1297-1303,共7页
针对当前大多数图像描述模型仅利用图像内容推理生成图像描述而导致描述内容缺失、准确性差的问题,通过引入知识图谱增强生成字幕的语义完整性,利用全局上下文信息约束进一步增加生成描述的准确性,提出一种基于知识图谱与全局上下文注... 针对当前大多数图像描述模型仅利用图像内容推理生成图像描述而导致描述内容缺失、准确性差的问题,通过引入知识图谱增强生成字幕的语义完整性,利用全局上下文信息约束进一步增加生成描述的准确性,提出一种基于知识图谱与全局上下文注意的图像描述模型。通过利用知识图谱,将外部知识编码到模型当中,提高生成初始语义信息的完整性;从初始的完整描述中获取全局上下文信息,利用上下文信息进一步约束指导最终生成的图像描述,提高图像描述结果的准确性。在两个不同规模的标准数据集MSCOCO和Flickr30k上与其它先进方法进行实验对比,其结果表明,该模型在评价指标上均有所提高,验证了所提方法的有效性。 展开更多
关键词 图像描述 编码器解码器框架 长短期记忆网络 注意机制 知识图谱 外部知识 全局上下文注意
在线阅读 下载PDF
双注意力随机选择全局上下文细粒度识别网络
6
作者 徐胜军 荆扬 +3 位作者 段中兴 李明海 李海涛 刘福友 《液晶与显示》 CAS CSCD 北大核心 2024年第4期506-521,共16页
针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空... 针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空间随机选择,使网络能够关注到其他潜在微小判别性特征;其次,利用全局上下文注意力模块将深层特征的语义信息融合到中间层,增强中间层定位微小特征的能力;最后,提出一种多分支损失,对中间层、深层和拼接层特征引入分类损失,结合不同分支提取到的特征,诱导网络获得多样性的判别特征。所提网络在Stanford-cars、CUB-200-2011、FGVC-Aircraft 3个公开细粒度数据集和真实场景下车型数据集VMRURS上分别达到了95.2%、92.1%、94.0%和97.0%的识别准确率,其性能相比其他对比方法有较大幅度提升。 展开更多
关键词 细粒度识别 ConvNeXt 注意力随机选择 全局上下文注意力 多分支损失
在线阅读 下载PDF
双向建模增强TKAN和全局注意力机制融合的滚动轴承剩余寿命预测
7
作者 姜蕾 郑建飞 +3 位作者 胡昌华 赵瑞星 韩其辉 杨立浩 《自动化学报》 北大核心 2025年第8期1857-1868,共12页
滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键.针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题,提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺... 滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键.针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题,提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺尔德注意力网络(Bi-TKAN-Att).该模型兼具了时序科尔莫戈洛夫−阿诺尔德网络的强时序建模能力和全局注意力机制的关键特征提取能力,采用双向建模的方式捕捉前后向信息,最终实现了具有长期依赖多维退化特征的滚动轴承RUL预测.所提方法在滚动轴承数据集上进行实验验证,结果表明Bi-TKAN-Att模型在捕获滚动轴承退化特性和提升RUL预测精度方面具有显著优势,并通过消融实验证明了模型各组件的合理性和有效性,为滚动轴承的寿命预测提供了全新可行的解决方案. 展开更多
关键词 剩余使用寿命预测 滚动轴承 时序科尔莫戈洛夫-阿诺尔德网络 双向建模 全局注意力机制
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法 被引量:1
8
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-Transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
基于SE注意力机制与互信息量的解纠缠跨语种语音转换
9
作者 李燕萍 谭誌诚 +2 位作者 胡澄阳 杨露露 邵曦 《信号处理》 北大核心 2025年第1期183-192,共10页
在跨语种语音转换(Cross-Lingual Voice Conversion, CLVC)任务中,如何保留转换语音中的内容信息,同时有效地提高转换语音的相似度和自然度是目前的研究难题。传统的编码器-解码器模型应用于跨语种语音转换时,通常会对语音进行相互独立... 在跨语种语音转换(Cross-Lingual Voice Conversion, CLVC)任务中,如何保留转换语音中的内容信息,同时有效地提高转换语音的相似度和自然度是目前的研究难题。传统的编码器-解码器模型应用于跨语种语音转换时,通常会对语音进行相互独立的内容编码和说话人编码,导致得到的内容表征和说话人表征之间存在一定的信息泄露,从而使得转换语音的说话人个性相似度不够理想。为了解决上述存在的问题,本文提出一种基于SE注意力机制(Squeeze-and-Excitation Attention Mechanism, SE)与互信息量(Mutual Information, MI)的跨语种语音转换方法,实现有效的表征解纠缠,完成开集情形下高质量的跨语种语音转换。首先,在内容编码器中引入SE注意力机制以利用其对全局信息的提取能力,使得内容编码器可以提取包含全局上下文信息的内容表征;同时,在各个表征之间引入互信息量,并通过对其最小化来大幅减少各个表征之间存在的信息泄露问题,从而实现有效的表征解纠缠。在VCTK英文语料库和AISHELL-3中文语料库上的实验结果表明,本文提出的基于SE注意力机制与互信息量的跨语种语音转换模型(Squeeze-and-Excitation Attention Mechanism and Mutual Information, SEMI)具有更强的表征提取能力,相比于基准模型,其在客观评价中MCD值降低了10.89%,在主观评价中MOS值和ABX值分别提升了10.94%和12.06%,验证了SEMI模型在转换语音质量和说话人个性相似度方面都取得显著进展,实现了开集情形下高质量的跨语种语音转换。 展开更多
关键词 跨语种语音转换 SE注意力机制 互信息量 全局上下文信息
在线阅读 下载PDF
多尺度残差与全局注意力结合的低剂量CT去噪
10
作者 孙亚楠 陈平 潘晋孝 《应用光学》 北大核心 2025年第2期292-299,共8页
针对目前低剂量CT(low dose computed tomography,LDCT)图像去噪方法由于缺乏对空间特征和去噪任务之间的内在联系,导致重建图像的纹理细节丢失和过于平滑的问题,提出了一种结合多尺度密集残差和全局注意力的图像去噪网络。通过引入多... 针对目前低剂量CT(low dose computed tomography,LDCT)图像去噪方法由于缺乏对空间特征和去噪任务之间的内在联系,导致重建图像的纹理细节丢失和过于平滑的问题,提出了一种结合多尺度密集残差和全局注意力的图像去噪网络。通过引入多尺度密集残差块来提取图像的多尺度特征信息,并通过全局注意力机制(global attention mechanism,GAM)来关注模型不同通道间的跨维信息,同时加入跳跃连接进一步扩大全局交互特征的范围,最后使用多尺度特征损失函数增强图像纹理细节,避免图像过于平滑的问题。经过实验验证,本文所提出的算法在峰值信噪比(PSNR)和结构相似度(SSIM)这两项指标上分别达到了35.1838 dB、0.9605,在去除噪声的同时很好地保留了图像细节信息,优于其他算法。 展开更多
关键词 低剂量CT 图像去噪 多尺度密集残差 全局注意力机制
在线阅读 下载PDF
基于上下文提取与注意力融合的遮挡服装图像分割 被引量:1
11
作者 顾梅花 花玮 +1 位作者 董晓晓 张晓丹 《纺织学报》 EI CAS CSCD 北大核心 2024年第5期155-164,共10页
针对遮挡服装图像分割准确率低的问题,提出一种融合上下文提取与注意力机制的遮挡服装图像实例分割方法。以Mask R-CNN为基础网络,首先采用上下文提取模块优化ResNet的输出特征,通过融合不同速率的多路径特征从多个感受野中捕获图像的... 针对遮挡服装图像分割准确率低的问题,提出一种融合上下文提取与注意力机制的遮挡服装图像实例分割方法。以Mask R-CNN为基础网络,首先采用上下文提取模块优化ResNet的输出特征,通过融合不同速率的多路径特征从多个感受野中捕获图像的上下文信息,强化遮挡服装特征表示的识别及提取能力;然后引入通道注意力机制与空间注意力机制的残差连接,自适应地专注于捕捉遮挡服装图像的空间和通道维度上的语义相互依赖关系,降低上下文提取模块在处理特征图时因冗余的上下文关系扩大造成误定位与误识别的概率;最后,采用目标检测损失函数CIoU计算原理作为非极大值抑制的评判标准,关注预测框和真实框的重叠与非重叠区域,最大程度地选择遮挡服装的最优目标框,使预测框更加贴近真实框。结果表明,与其它方法相比,改进方法显著改善了不同遮挡程度服装图像的误分割现象,能提取出更精确的服装实例,其对遮挡服装图像的平均分割精度比原模型提升了4.4%。 展开更多
关键词 图像分割 遮挡服装 上下文提取 注意力机制 CIoU计算原理
在线阅读 下载PDF
SG-UNet:基于全局注意力和自校准卷积增强的黑色素瘤分割模型
12
作者 计寰宇 王蕊 +1 位作者 高盛祥 车文刚 《南方医科大学学报》 北大核心 2025年第6期1317-1326,共10页
目的 提出了一种新的黑色素瘤分割模型SG-UNet,以提高黑色素瘤皮肤镜图像的精确分割。通过分割后边界特征评估,可以更准确地识别诊断黑色素瘤从而辅助早期诊断。方法 使用一种U形结构的卷积神经网络UNet,对其主干、跳跃连接和下采样池... 目的 提出了一种新的黑色素瘤分割模型SG-UNet,以提高黑色素瘤皮肤镜图像的精确分割。通过分割后边界特征评估,可以更准确地识别诊断黑色素瘤从而辅助早期诊断。方法 使用一种U形结构的卷积神经网络UNet,对其主干、跳跃连接和下采样池化部分进行改进。在主干部分,我们将UNet的下采样部分参考Vgg的结构将卷积数量由10个增加到13个加深网络层次来捕获更加精细的特征表示。为了进一步提升特征提取和细节识别的能力,主干部分将传统的卷积替换为自校准卷积增强模型对空间维度和通道维度特征的捕获能力。同时,在池化部分将哈尔小波下采样替换原有的池化层实现更有效的多尺度特征融合,并降低特征图的空间分辨率。接着将全局注意力机制融入到每一层的跳跃连接中更好地理解图像的上下文信息。结果实验结果表明SG-UNet在ISIC 2017和ISIC 2018数据集上的分割效果对比目前其他先进分割模型得到明显提升。在ISIC2017和ISIC 2018数据集上Dice,IoU分别达到了92.41%,86.62%和92.31%,86.48%。结论 实验结果证实,所提出的方法能够有效实现黑色素瘤的精确分割。 展开更多
关键词 图像分割 全局注意力机制 黑色素瘤 UNet 自校准卷积 哈尔小波下采样 SG-UNet
在线阅读 下载PDF
基于注意力机制与残差结构的联合调制识别
13
作者 郑向阳 王忠勇 +3 位作者 杨晨旭 陈家伟 巩克现 王玮 《计算机应用与软件》 北大核心 2025年第10期163-170,共8页
针对多种信号调制类型识别,提出一种信号调制类型联合结构识别分类器,对接收信号二值化分类并分别输入两种网络进行自动识别。在高信噪比区间,利用深度可分离卷积引入跳跃连接方法叠加残差结构,同时添加多头自注意力机制代替部分卷积,... 针对多种信号调制类型识别,提出一种信号调制类型联合结构识别分类器,对接收信号二值化分类并分别输入两种网络进行自动识别。在高信噪比区间,利用深度可分离卷积引入跳跃连接方法叠加残差结构,同时添加多头自注意力机制代替部分卷积,获得优于以上两种机制的性能;在低信噪比区间,利用Transformer的自注意力机制判断输入序列不同区域的重要性,提取更加有效的特征信息。通过公开数据集的数据实验,验证了联合结构的识别有效性,低信噪比区间的识别准确率得到显著提高,高信噪比区间识别率得到进一步提升的同时,验证得到所提算法具有相对较低的复杂度。 展开更多
关键词 自动调制分类 卷积神经网络 多头自注意力机制 深度可分离卷积 全局深度卷积
在线阅读 下载PDF
引入全局上下文模块和高效注意力机制的车辆跟踪算法 被引量:5
14
作者 李畅 王一丁 +1 位作者 孙芮 何忠贺 《科学技术与工程》 北大核心 2022年第11期4424-4433,共10页
孪生全卷积神经网络目标跟踪算法(SiamFC)近些年成为车辆跟踪领域的研究热点。但该算法缺乏对目标车辆的深层特征提取和整体感知,在背景复杂、低分辨率、光照变化的情况下容易跟丢。提出使用深度残差网络ResNet50作为主干网络,根据跟踪... 孪生全卷积神经网络目标跟踪算法(SiamFC)近些年成为车辆跟踪领域的研究热点。但该算法缺乏对目标车辆的深层特征提取和整体感知,在背景复杂、低分辨率、光照变化的情况下容易跟丢。提出使用深度残差网络ResNet50作为主干网络,根据跟踪模型特性,从剪裁特征图、调整网络总步长和嵌入高效通道注意力模块三方面对其进行优化,高效提取特征的同时增强模型的差异化认知,并在分支网络引入全局上下文模块(non-local network,NLNet),增强跟踪模型对目标车辆的整体感知。经实验证明,提出的算法在低分辨率、光照变化和复杂背景的情况下跟踪速度和鲁棒性显著提升。在VOT2018和OTB2015数据集中测试均能得到较好的跟踪结果,与经典跟踪模型SiamFC相比,在OTB2015数据集中测试的跟踪精度提高了5.5%,跟踪成功率提高了2.7%,跟踪速度提高了14%可达98帧/s。 展开更多
关键词 孪生神经网络 车辆跟踪 高效注意力模块 全局上下文模块
在线阅读 下载PDF
基于全局注意力卷积神经网络的刀具磨损预测
15
作者 金坚 卢文壮 +1 位作者 吴超逸 徐洛 《工具技术》 北大核心 2025年第7期134-138,共5页
刀具磨损状态的精准预测对于提高加工质量和加工效率有着重要意义,基于传统CNN的刀具磨损预测模型未考虑特征信息之间的交互汇聚,预测精度存在局限。针对此问题,本文提出一种基于全局注意力卷积神经网络(GAM-CNN)的刀具磨损预测模型。... 刀具磨损状态的精准预测对于提高加工质量和加工效率有着重要意义,基于传统CNN的刀具磨损预测模型未考虑特征信息之间的交互汇聚,预测精度存在局限。针对此问题,本文提出一种基于全局注意力卷积神经网络(GAM-CNN)的刀具磨损预测模型。该刀具磨损预测模型在卷积神经网络基础上添加全局注意力机制,该机制通过通道和空间双注意力将卷积神经网络提取到的特征进行加权汇聚,更好地突出重要特征并与预测值进行关联。预测实验结果表明,该预测模型的MAE为13.83μm、RMSE为17.33μm、MAPE为12.58%,均优于对比的未含全局注意力机制的CNN、CAM-CNN以及PSO-SVR模型。 展开更多
关键词 刀具磨损 预测 全局注意力机制 卷积神经网络
在线阅读 下载PDF
基于全局上下文和注意力机制深度卷积神经网络的地震数据去噪 被引量:16
16
作者 杨翠倩 周亚同 +2 位作者 何昊 崔焘 王杨 《石油物探》 CSCD 北大核心 2021年第5期751-762,855,共13页
在地震数据处理中,随机噪声压制是提高地震数据信噪比的关键。针对目前卷积神经网络大多关注局部特征以及在特征提取方面的局限性,提出了一种结合全局上下文和注意力机制的深度卷积神经网络(global context and attention-based deep co... 在地震数据处理中,随机噪声压制是提高地震数据信噪比的关键。针对目前卷积神经网络大多关注局部特征以及在特征提取方面的局限性,提出了一种结合全局上下文和注意力机制的深度卷积神经网络(global context and attention-based deep convolutional neural network,GC-ADNet),并用残差学习压制地震数据随机噪声的方法。其中,全局上下文模块(global context block,GCBlock)既关注局部信息,又能提取全局上下文信息;注意力模块(Attention Block)不仅强调关键特征,还能高效提取隐藏在复杂背景中的噪声信息。加入残差学习和批量规范化方法加快了网络的训练和收敛速度,使用扩张卷积扩大上下文信息并降低计算成本。将GC-ADNet应用于合成和实际地震数据处理,并与现有的去噪方法进行了比较。实验结果表明,GC-ADNet能够更有效压制随机噪声,并保留更多局部细节信息。 展开更多
关键词 地震数据 全局上下文 注意力机制 噪声压制 深度卷积神经网络
在线阅读 下载PDF
注意力机制和全局卷积在光伏板分割中的应用 被引量:2
17
作者 李青 李海涛 +1 位作者 李辉 张俊虎 《计算机工程与应用》 CSCD 北大核心 2024年第4期237-248,共12页
准确识别光伏对光伏产业有效健康发展至关重要。高分辨率遥感图像复杂的背景和光伏板形状颜色多变给光伏识别带来巨大的挑战。针对高分辨率遥感图像中光伏用地提取问题,提出网络以精确地提取光伏用地。该网络采用编码器和解码器的形式... 准确识别光伏对光伏产业有效健康发展至关重要。高分辨率遥感图像复杂的背景和光伏板形状颜色多变给光伏识别带来巨大的挑战。针对高分辨率遥感图像中光伏用地提取问题,提出网络以精确地提取光伏用地。该网络采用编码器和解码器的形式融合多层特征以结合丰富的语义信息,利用全局卷积和双注意力机制捕获重要的空间特征和通道特征,并使用通道融合模块恢复丢失的部分通道信息。提出的方法可以有效解决光伏板边缘模糊和光伏板粘连的问题。在公开光伏数据集上的实验表明,与U-Net、SegNet、DeepLabv3和DeepLabv3+相比,所提方法在PV01、PV03、PV08三个数据集上的IoU分别达到87.02%、92.98%和88.43%。实验证明所提方法能对高分辨率遥感图像光伏板进行高准确率分割。 展开更多
关键词 高分辨率遥感图像 光伏用地 全局卷积 注意力机制 语义分割
在线阅读 下载PDF
嵌入注意力机制并结合层级上下文的语音情感识别 被引量:9
18
作者 程艳芬 陈垚鑫 +1 位作者 陈逸灵 杨益 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2019年第11期100-107,共8页
由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入... 由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入注意力机制并结合层级上下文学习的双向长短时记忆(BLSTM)网络模型.模型分3个阶段完成语音情感识别任务,第1阶段提取情感语音特征全集后采用SVM-RFE特征排序算法降维得到最优特征子集,并对其进行注意力加权;第2阶段将加权后的特征子集输入BLSTM网络学习特征层上下文获得最初情感预测结果;第3阶段利用情感标签值对另一独立BLSTM网络训练学习标签层上下文信息并据此在第2阶段输出结果基础上完成最终预测.模型嵌入注意力机制使其自动学习调整对输入特征子集的关注度,引入标签层上下文使其联合特征层上下文实现层级上下文信息融合提高鲁棒性,提升了模型对情感语音的建模能力,在SEMAINE和RECOLA数据集上实验结果表明:与基线模型相比RMSE和CCC均得到较好改善. 展开更多
关键词 语音情感识别 注意力机制 上下文 双向长短时记忆网络
在线阅读 下载PDF
基于全局补偿注意力机制的战场图像去雾方法 被引量:1
19
作者 林森 王金刚 高宏伟 《兵工学报》 EI CAS CSCD 北大核心 2024年第4期1344-1353,共10页
在现代化战争中,广泛利用图像等载体获取信息,但雾天环境下得到的图像不仅影响场景呈现,而且会掩盖重要特征。为提高雾天图像在现代化战争的利用价值,提出一种基于全局补偿注意力机制的战场图像去雾方法。构建全局补偿模块保证输出图像... 在现代化战争中,广泛利用图像等载体获取信息,但雾天环境下得到的图像不仅影响场景呈现,而且会掩盖重要特征。为提高雾天图像在现代化战争的利用价值,提出一种基于全局补偿注意力机制的战场图像去雾方法。构建全局补偿模块保证输出图像的完整性,并加入通道下采样恢复清晰图像;使用密集残差模块学习退化图像和清晰图像的非线性映射,同时加入注意力机制提高网络的灵活处理能力;通过提升输入图像的通道数量确保网络充分学习特征信息。实验结果表明,与经典和新颖图像去雾方法比较,所提方法在主观和客观评价上均取得出色成绩,说明该方法将注意力机制和全局补偿模块充分结合,有效缓解了战场图像退化问题,同时注重特征增强,使信息得以完整呈现,具有更优越的性能。 展开更多
关键词 战场图像去雾 全局补偿 注意力机制 密集残差模块
在线阅读 下载PDF
融合注意力与上下文信息的皮肤癌图像分割模型 被引量:1
20
作者 支慧芳 韩建新 吴永飞 《计算机工程与设计》 北大核心 2024年第9期2859-2865,共7页
为提高黑色素瘤分割性能,提出一种结合注意力机制和上下文信息的U-Net网络。以Resnet-34网络作为编码器,在跳跃连接中加入坐标注意力,通过捕捉精准的位置信息定位更准确的目标区域;设计上下文信息模块强化对前景特征的学习能力;加入高... 为提高黑色素瘤分割性能,提出一种结合注意力机制和上下文信息的U-Net网络。以Resnet-34网络作为编码器,在跳跃连接中加入坐标注意力,通过捕捉精准的位置信息定位更准确的目标区域;设计上下文信息模块强化对前景特征的学习能力;加入高效通道注意力模块,重新校准权重并获得更高质量的分割图。在公共数据集ISIC 2017上验证改进模型,其结果表明,该模型召回率、F1分数达到85.29%、87.03%,与现有方法对比,在准确率、交并比、召回率、F1分数产生竞争性结果。 展开更多
关键词 病变分割 多尺度融合 注意力机制 上下文信息 卷积神经网络 U-Net型网络 坐标注意力 高效通道注意力
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部