期刊文献+
共找到112篇文章
< 1 2 6 >
每页显示 20 50 100
面向分割的局部分块与全局多尺度注意力机制
1
作者 谭荆彬 赵旭俊 苏慧娟 《计算机工程与设计》 北大核心 2025年第4期1141-1148,共8页
现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个... 现有的注意力机制仅增强特征图的通道或空间维度,未能充分捕捉细微视觉元素和多尺度特征变化。为解决此问题,提出一种基于局部分块与全局多尺度特征融合的注意力机制(patch and global multiscale attention,PGMA)。将特征图分割成多个小块,分别计算这些小块的注意力得分,增强对局部信息的感知能力。使用一组空洞卷积计算整个特征图的得分,获得全局多尺度信息的权衡。实验中,将PGMA集成到U-Net、DeepLab、SegNet等语义分割网络中,有效提升了它们的分割性能。这表明PGMA在增强CNN性能方面优于当前主流方法。 展开更多
关键词 卷积神经网络 注意机制 局部信息 分块策略 细节感知 全局多尺度信息 语义分割
在线阅读 下载PDF
多尺度残差与全局注意力结合的低剂量CT去噪
2
作者 孙亚楠 陈平 潘晋孝 《应用光学》 北大核心 2025年第2期292-299,共8页
针对目前低剂量CT(low dose computed tomography,LDCT)图像去噪方法由于缺乏对空间特征和去噪任务之间的内在联系,导致重建图像的纹理细节丢失和过于平滑的问题,提出了一种结合多尺度密集残差和全局注意力的图像去噪网络。通过引入多... 针对目前低剂量CT(low dose computed tomography,LDCT)图像去噪方法由于缺乏对空间特征和去噪任务之间的内在联系,导致重建图像的纹理细节丢失和过于平滑的问题,提出了一种结合多尺度密集残差和全局注意力的图像去噪网络。通过引入多尺度密集残差块来提取图像的多尺度特征信息,并通过全局注意力机制(global attention mechanism,GAM)来关注模型不同通道间的跨维信息,同时加入跳跃连接进一步扩大全局交互特征的范围,最后使用多尺度特征损失函数增强图像纹理细节,避免图像过于平滑的问题。经过实验验证,本文所提出的算法在峰值信噪比(PSNR)和结构相似度(SSIM)这两项指标上分别达到了35.1838 dB、0.9605,在去除噪声的同时很好地保留了图像细节信息,优于其他算法。 展开更多
关键词 低剂量CT 图像去噪 多尺度密集残差 全局注意机制
在线阅读 下载PDF
基于SE注意力机制与互信息量的解纠缠跨语种语音转换
3
作者 李燕萍 谭誌诚 +2 位作者 胡澄阳 杨露露 邵曦 《信号处理》 北大核心 2025年第1期183-192,共10页
在跨语种语音转换(Cross-Lingual Voice Conversion, CLVC)任务中,如何保留转换语音中的内容信息,同时有效地提高转换语音的相似度和自然度是目前的研究难题。传统的编码器-解码器模型应用于跨语种语音转换时,通常会对语音进行相互独立... 在跨语种语音转换(Cross-Lingual Voice Conversion, CLVC)任务中,如何保留转换语音中的内容信息,同时有效地提高转换语音的相似度和自然度是目前的研究难题。传统的编码器-解码器模型应用于跨语种语音转换时,通常会对语音进行相互独立的内容编码和说话人编码,导致得到的内容表征和说话人表征之间存在一定的信息泄露,从而使得转换语音的说话人个性相似度不够理想。为了解决上述存在的问题,本文提出一种基于SE注意力机制(Squeeze-and-Excitation Attention Mechanism, SE)与互信息量(Mutual Information, MI)的跨语种语音转换方法,实现有效的表征解纠缠,完成开集情形下高质量的跨语种语音转换。首先,在内容编码器中引入SE注意力机制以利用其对全局信息的提取能力,使得内容编码器可以提取包含全局上下文信息的内容表征;同时,在各个表征之间引入互信息量,并通过对其最小化来大幅减少各个表征之间存在的信息泄露问题,从而实现有效的表征解纠缠。在VCTK英文语料库和AISHELL-3中文语料库上的实验结果表明,本文提出的基于SE注意力机制与互信息量的跨语种语音转换模型(Squeeze-and-Excitation Attention Mechanism and Mutual Information, SEMI)具有更强的表征提取能力,相比于基准模型,其在客观评价中MCD值降低了10.89%,在主观评价中MOS值和ABX值分别提升了10.94%和12.06%,验证了SEMI模型在转换语音质量和说话人个性相似度方面都取得显著进展,实现了开集情形下高质量的跨语种语音转换。 展开更多
关键词 跨语种语音转换 SE注意机制 互信息量 全局上下文信息
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法
4
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意机制 CNN-Transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
基于注意力机制改进的叉车疲劳驾驶检测
5
作者 陆军伟 《农业装备与智能技术》 2025年第1期29-33,共5页
针对叉车驾驶存在司机易疲劳驾驶的问题,提出一种基于注意力机制改进的疲劳驾驶检测方法。该方法通过引入GAM注意力机制,能够有效地捕捉和提取与疲劳驾驶相关的特征信息,提高疲劳驾驶检测的准确性和鲁棒性。在网络设计结构方面,系统采用... 针对叉车驾驶存在司机易疲劳驾驶的问题,提出一种基于注意力机制改进的疲劳驾驶检测方法。该方法通过引入GAM注意力机制,能够有效地捕捉和提取与疲劳驾驶相关的特征信息,提高疲劳驾驶检测的准确性和鲁棒性。在网络设计结构方面,系统采用YOLOv5作为基础检测架构。为了进一步提高对驾驶员疲劳特征的识别能力,在YOLOv5的基础上集成了GAM注意力机制,使网络更加集中于疲劳特征的提取,并抑制无关信息的干扰。实验结果表明,与传统的SSD、YOLOv3及YOLOv5疲劳检测方法相比,基于GAM注意力机制改进的YOLOv5叉车疲劳驾驶检测系统在不同测试场景下的检测准确率达到92.1%,漏检率为3.5%。 展开更多
关键词 gam注意机制 YOLOv5 叉车驾驶 疲劳驾驶
在线阅读 下载PDF
注意力机制和全局卷积在光伏板分割中的应用 被引量:2
6
作者 李青 李海涛 +1 位作者 李辉 张俊虎 《计算机工程与应用》 CSCD 北大核心 2024年第4期237-248,共12页
准确识别光伏对光伏产业有效健康发展至关重要。高分辨率遥感图像复杂的背景和光伏板形状颜色多变给光伏识别带来巨大的挑战。针对高分辨率遥感图像中光伏用地提取问题,提出网络以精确地提取光伏用地。该网络采用编码器和解码器的形式... 准确识别光伏对光伏产业有效健康发展至关重要。高分辨率遥感图像复杂的背景和光伏板形状颜色多变给光伏识别带来巨大的挑战。针对高分辨率遥感图像中光伏用地提取问题,提出网络以精确地提取光伏用地。该网络采用编码器和解码器的形式融合多层特征以结合丰富的语义信息,利用全局卷积和双注意力机制捕获重要的空间特征和通道特征,并使用通道融合模块恢复丢失的部分通道信息。提出的方法可以有效解决光伏板边缘模糊和光伏板粘连的问题。在公开光伏数据集上的实验表明,与U-Net、SegNet、DeepLabv3和DeepLabv3+相比,所提方法在PV01、PV03、PV08三个数据集上的IoU分别达到87.02%、92.98%和88.43%。实验证明所提方法能对高分辨率遥感图像光伏板进行高准确率分割。 展开更多
关键词 高分辨率遥感图像 光伏用地 全局卷积 注意机制 语义分割
在线阅读 下载PDF
SG-UNet:基于全局注意力和自校准卷积增强的黑色素瘤分割模型
7
作者 计寰宇 王蕊 +1 位作者 高盛祥 车文刚 《南方医科大学学报》 北大核心 2025年第6期1317-1326,共10页
目的 提出了一种新的黑色素瘤分割模型SG-UNet,以提高黑色素瘤皮肤镜图像的精确分割。通过分割后边界特征评估,可以更准确地识别诊断黑色素瘤从而辅助早期诊断。方法 使用一种U形结构的卷积神经网络UNet,对其主干、跳跃连接和下采样池... 目的 提出了一种新的黑色素瘤分割模型SG-UNet,以提高黑色素瘤皮肤镜图像的精确分割。通过分割后边界特征评估,可以更准确地识别诊断黑色素瘤从而辅助早期诊断。方法 使用一种U形结构的卷积神经网络UNet,对其主干、跳跃连接和下采样池化部分进行改进。在主干部分,我们将UNet的下采样部分参考Vgg的结构将卷积数量由10个增加到13个加深网络层次来捕获更加精细的特征表示。为了进一步提升特征提取和细节识别的能力,主干部分将传统的卷积替换为自校准卷积增强模型对空间维度和通道维度特征的捕获能力。同时,在池化部分将哈尔小波下采样替换原有的池化层实现更有效的多尺度特征融合,并降低特征图的空间分辨率。接着将全局注意力机制融入到每一层的跳跃连接中更好地理解图像的上下文信息。结果实验结果表明SG-UNet在ISIC 2017和ISIC 2018数据集上的分割效果对比目前其他先进分割模型得到明显提升。在ISIC2017和ISIC 2018数据集上Dice,IoU分别达到了92.41%,86.62%和92.31%,86.48%。结论 实验结果证实,所提出的方法能够有效实现黑色素瘤的精确分割。 展开更多
关键词 图像分割 全局注意机制 黑色素瘤 UNet 自校准卷积 哈尔小波下采样 SG-UNet
在线阅读 下载PDF
基于全局注意力卷积神经网络的刀具磨损预测
8
作者 金坚 卢文壮 +1 位作者 吴超逸 徐洛 《工具技术》 北大核心 2025年第7期134-138,共5页
刀具磨损状态的精准预测对于提高加工质量和加工效率有着重要意义,基于传统CNN的刀具磨损预测模型未考虑特征信息之间的交互汇聚,预测精度存在局限。针对此问题,本文提出一种基于全局注意力卷积神经网络(GAM-CNN)的刀具磨损预测模型。... 刀具磨损状态的精准预测对于提高加工质量和加工效率有着重要意义,基于传统CNN的刀具磨损预测模型未考虑特征信息之间的交互汇聚,预测精度存在局限。针对此问题,本文提出一种基于全局注意力卷积神经网络(GAM-CNN)的刀具磨损预测模型。该刀具磨损预测模型在卷积神经网络基础上添加全局注意力机制,该机制通过通道和空间双注意力将卷积神经网络提取到的特征进行加权汇聚,更好地突出重要特征并与预测值进行关联。预测实验结果表明,该预测模型的MAE为13.83μm、RMSE为17.33μm、MAPE为12.58%,均优于对比的未含全局注意力机制的CNN、CAM-CNN以及PSO-SVR模型。 展开更多
关键词 刀具磨损 预测 全局注意机制 卷积神经网络
在线阅读 下载PDF
基于知识图谱与全局上下文注意的图像描述生成模型
9
作者 陶瑞 张素兰 周慧媛 《计算机工程与设计》 北大核心 2025年第5期1297-1303,共7页
针对当前大多数图像描述模型仅利用图像内容推理生成图像描述而导致描述内容缺失、准确性差的问题,通过引入知识图谱增强生成字幕的语义完整性,利用全局上下文信息约束进一步增加生成描述的准确性,提出一种基于知识图谱与全局上下文注... 针对当前大多数图像描述模型仅利用图像内容推理生成图像描述而导致描述内容缺失、准确性差的问题,通过引入知识图谱增强生成字幕的语义完整性,利用全局上下文信息约束进一步增加生成描述的准确性,提出一种基于知识图谱与全局上下文注意的图像描述模型。通过利用知识图谱,将外部知识编码到模型当中,提高生成初始语义信息的完整性;从初始的完整描述中获取全局上下文信息,利用上下文信息进一步约束指导最终生成的图像描述,提高图像描述结果的准确性。在两个不同规模的标准数据集MSCOCO和Flickr30k上与其它先进方法进行实验对比,其结果表明,该模型在评价指标上均有所提高,验证了所提方法的有效性。 展开更多
关键词 图像描述 编码器解码器框架 长短期记忆网络 注意机制 知识图谱 外部知识 全局上下文注意
在线阅读 下载PDF
基于全局补偿注意力机制的战场图像去雾方法 被引量:1
10
作者 林森 王金刚 高宏伟 《兵工学报》 EI CAS CSCD 北大核心 2024年第4期1344-1353,共10页
在现代化战争中,广泛利用图像等载体获取信息,但雾天环境下得到的图像不仅影响场景呈现,而且会掩盖重要特征。为提高雾天图像在现代化战争的利用价值,提出一种基于全局补偿注意力机制的战场图像去雾方法。构建全局补偿模块保证输出图像... 在现代化战争中,广泛利用图像等载体获取信息,但雾天环境下得到的图像不仅影响场景呈现,而且会掩盖重要特征。为提高雾天图像在现代化战争的利用价值,提出一种基于全局补偿注意力机制的战场图像去雾方法。构建全局补偿模块保证输出图像的完整性,并加入通道下采样恢复清晰图像;使用密集残差模块学习退化图像和清晰图像的非线性映射,同时加入注意力机制提高网络的灵活处理能力;通过提升输入图像的通道数量确保网络充分学习特征信息。实验结果表明,与经典和新颖图像去雾方法比较,所提方法在主观和客观评价上均取得出色成绩,说明该方法将注意力机制和全局补偿模块充分结合,有效缓解了战场图像退化问题,同时注重特征增强,使信息得以完整呈现,具有更优越的性能。 展开更多
关键词 战场图像去雾 全局补偿 注意机制 密集残差模块
在线阅读 下载PDF
基于全局注意力的Gam-EEGNet在SSVEP分类中的应用 被引量:2
11
作者 刘俊杰 谢俊 +1 位作者 王虎 胡博 《电子测量技术》 北大核心 2024年第22期76-83,共8页
稳态视觉诱发电位(SSVEP)作为脑机接口(BCI)系统中的重要信号类型,因其高稳定性和易操作性而广泛应用于BCI研究。在过去的研究中,已有许多方法在SSVEP信号分类中取得了显著进展,但依然面临着信噪比低、信号非平稳性和个体差异大的挑战... 稳态视觉诱发电位(SSVEP)作为脑机接口(BCI)系统中的重要信号类型,因其高稳定性和易操作性而广泛应用于BCI研究。在过去的研究中,已有许多方法在SSVEP信号分类中取得了显著进展,但依然面临着信噪比低、信号非平稳性和个体差异大的挑战。为进一步提升SSVEP分类的准确性和实用性,本文提出了一种结合全局注意力机制与紧凑脑电网络(EEGNet)的新型神经网络架构——Gam-EEGNet。EEGNet作为一种紧凑、高效且适应性强的基础模型,在SSVEP信号处理中具有重要作用。通过在EEGNet中引入全局注意力机制,Gam-EEGNet能够更精确地提取和表征SSVEP信号特征,从而有效降低个体差异和噪声的影响。实验采用了涵盖12种不同频率的SSVEP脑电数据,并将Gam-EEGNet与典型卷积神经网络(CCNN)、滤波器组-时间卷积神经网络(FB-tCNN)和滤波器组-时间卷积神经网络(SSVEPNet)等主流深度学习方法进行了分类性能对比。结果表明,Gam-EEGNet在不同时间窗口下的分类准确率和信息传输率(ITR)均优于其他方法,特别是在0.7 s的短时间窗口内,分类精度达到86.58%;在1 s时间窗内,多名被试者的平均识别准确率超过95%,ITR超过189 bits/min。此外,Gam-EEGNet在训练过程中表现出更好的收敛性和稳定性,具有更快的收敛速度和更低的训练误差。这些结果表明,Gam-EEGNet在SSVEP信号分类中展现出显著的性能提升,尤其适用于实时BCI系统中的快速响应场景,具有广泛的应用潜力。 展开更多
关键词 深度学习 脑-机接口 稳态视觉诱发电位 全局注意机制 gam-EEGNet模型
在线阅读 下载PDF
局部注意力引导下的全局池化残差分类网络 被引量:2
12
作者 姜文涛 董睿 张晟翀 《光电工程》 CAS CSCD 北大核心 2024年第7期107-124,共18页
大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其... 大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其次提出多分割局部增强注意力机制(MSLE)模块,MSLE模块将图像整体分割成多个小图像,增强每个小图像的局部特征,通过特征组交互的方式将局部重要特征引导到全局特征中;最后提出池化残差(PR)模块来处理ResNet残差结构丢失信息的问题,提高各层之间的信息利用率。实验结果表明,MSLENet通过增强局部特征的关联性,在多个数据集上均有良好的效果,有效地提高了网络的表达能力。 展开更多
关键词 图像分类 注意机制 残差结构 局部特征 全局特征 关联性
在线阅读 下载PDF
基于全局注意力机制的单像素成像图像增强方法 被引量:3
13
作者 刘辉 杨照华 +2 位作者 吴云 赵梓栋 余远金 《空间控制技术与应用》 CSCD 北大核心 2023年第6期68-76,共9页
单像素成像是一种仅需要使用无分辨能力的桶探测器结合空间光调制信息就能重构出一副完整图像的成像方式,具有非局域成像和高灵敏的特点,适合在外太空非合作目标下进行超远距离成像探测,但需要多次空间光调制后进行探测,重构图像信噪比... 单像素成像是一种仅需要使用无分辨能力的桶探测器结合空间光调制信息就能重构出一副完整图像的成像方式,具有非局域成像和高灵敏的特点,适合在外太空非合作目标下进行超远距离成像探测,但需要多次空间光调制后进行探测,重构图像信噪比低.本文提出一种基于全局注意力机制的低采样率下图像增强方法,利用Transformer结构搭建新型的SUNet(swin transformer unet)网络,解决传统卷积神经网络平移不变性和无法获得全局感受野的问题.根据切蛋糕(cake-cutting, CC)序改进的差分鬼成像算法在低采样条件下重构出低质量的图像,使用SUNet对图像进行增强.实验结果表明,该方法与2022年提出的GIDC(ghost imaging using deep neural network constraint)方法相比,在0.1的采样率下,峰值信噪比提升了3.29 dB,结构相似度提升了8%,为单像素成像的空间探测提供了新的技术途径. 展开更多
关键词 单像素成像 全局注意机制 图像增强 空间探测
在线阅读 下载PDF
结合全局注意力机制的实时语义分割网络 被引量:5
14
作者 李涛 高志刚 +2 位作者 管晟媛 徐久成 马媛媛 《智能系统学报》 CSCD 北大核心 2023年第2期282-292,共11页
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s... 针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。 展开更多
关键词 实时语义分割 全局注意机制 多尺度特征融合 混合空洞卷积 卷积神经网络 金字塔池化 感受野 特征提取
在线阅读 下载PDF
基于全局-局部特征和自适应注意力机制的图像语义描述算法 被引量:6
15
作者 赵小虎 尹良飞 赵成龙 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第1期126-134,共9页
为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对... 为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对图像的关注点,对图像细节的描述更加完善;在解码时加入注意力机制对图像特征加权输入,可以自适应选择当前时刻输出的文本单词对视觉信息与语义信息的依赖权重,有效地提高对图像语义描述的性能.实验结果表明,该方法相对于其他语义描述算法效果更有竞争力,可以更准确、更细致地识别图片中的物体,对输入图像进行更全面地描述;对于微小的物体的识别准确率更高. 展开更多
关键词 图像语义描述 图像关注点 高层语义信息 描述句子细节 全局-局部特征提取 自适应注意机制
在线阅读 下载PDF
融合动态场景感知和注意力机制的声学回声消除算法
16
作者 许春冬 黄乔月 +1 位作者 王磊 徐锦武 《信号处理》 CSCD 北大核心 2024年第2期396-405,共10页
在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统... 在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统回声消除系统存在去回声效果不明显、存在非线性回声残留以及无法实时处理回声等问题。因此,为解决上述存在问题,提出了一种动态场景感知模块(Dynamic scene perception module,DSPM)和全局注意力机制(Global attention mechanism,GAM)相结合的声学回声消除算法。该算法以卷积循环网络(Convolutional recurrent network,CRN)作为基线模型,提取语音信号的序列特征;首先,在其编码器中引入DSPM模块替换原因果卷积,根据场景动态分配卷积内核数量,加强模型的自适应性;其次,在编码器最后两层中分别引入GAM模块,放大空间通道间关系以及统筹全局交互,提升对语音信号特征的提取能力以及消除回声的性能;最后,通过将MSE损失函数和HuberLoss损失函数线性相加生成一种新的损失函数——MSE-HuberLoss,进一步提高模型的鲁棒性。实验结果表明,提出的GAM-DSPM-CRN模型的回声消除性能优秀,且获得较基线模型更加清晰的重构语音信号;在双端通话环境下,提出的GAM-DSPM-CRN模型声学回声消除算法较其他对比算法性能有较大提升;在Microsoft AEC Challenges数据集上,MOS、ERLE和STOI的得分分别达到了4.09、57.43和0.78。 展开更多
关键词 声学回声消除 动态场景感知模块 全局注意机制 卷积循环网络 联合损失函数
在线阅读 下载PDF
融合基序信息的图同构注意力网络的图分类问题研究
17
作者 衡红军 曹莹莹 《小型微型计算机系统》 北大核心 2025年第3期552-558,共7页
基于频繁子图挖掘算法的图分类方法无法避免子图同构计算,算法的效率低且忽略了节点特征信息,而基于图神经网络的方法则关注节点特征信息.本文提出一种融合基序信息的图同构注意力网络的图分类方法.该方法首先利用图的拓扑结构和节点类... 基于频繁子图挖掘算法的图分类方法无法避免子图同构计算,算法的效率低且忽略了节点特征信息,而基于图神经网络的方法则关注节点特征信息.本文提出一种融合基序信息的图同构注意力网络的图分类方法.该方法首先利用图的拓扑结构和节点类别信息,提取数据集中的子图结构构成基序集合,再基于基序集合生成基序级图嵌入表示,避免了频繁子图挖掘;然后在图同构网络的池化操作中引入全局注意力机制,学习高质量的节点级图嵌入表示;最后将基序级和节点级图嵌入表示拼接起来用于图分类.该图嵌入表示不仅包含了图中节点的特征信息,也反映了图的结构特征信息.实验结果表明,所构建的网络模型在五个公开数据集上取得了优异的分类精度. 展开更多
关键词 图分类 图神经网络 基序 全局注意机制
在线阅读 下载PDF
基于全局注意力机制和LSTM的连续手语识别算法 被引量:7
18
作者 杨观赐 韩海峰 +2 位作者 刘赛赛 蒋亚汶 李杨 《包装工程》 CAS 北大核心 2022年第8期28-34,共7页
目的 为提高连续手语识别准确率,缓解听障人群与非听障人群的沟通障碍。方法 提出了基于全局注意力机制和LSTM的连续手语识别算法。通过帧间差分法对视频数据进行预处理,消除视频冗余帧,借助ResNet网络提取特征序列。通过注意力机制加权... 目的 为提高连续手语识别准确率,缓解听障人群与非听障人群的沟通障碍。方法 提出了基于全局注意力机制和LSTM的连续手语识别算法。通过帧间差分法对视频数据进行预处理,消除视频冗余帧,借助ResNet网络提取特征序列。通过注意力机制加权,获得全局手语状态特征,并利用LSTM进行时序分析,形成一种基于全局注意力机制和LSTM的连续手语识别算法,实现连续手语识别。结果 实验结果表明,该算法在中文连续手语数据集CSL上的平均识别率为90.08%,平均词错误率为41.2%,与5种算法相比,该方法在识别准确率与翻译性能上具有优势。结论 基于全局注意力机制和LSTM的连续手语识别算法实现了连续手语识别,并且具有较好的识别效果及翻译性能,对促进听障人群无障碍融入社会方面具有积极的意义。 展开更多
关键词 手语识别 特征提取 全局注意机制 LSTM
在线阅读 下载PDF
一种改进的全局注意机制图像描述方法 被引量:6
19
作者 马书磊 张国宾 +1 位作者 焦阳 石光明 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第2期17-22,共6页
针对现有基于注意机制的图像描述方法全局信息缺失问题,提出了一种改进的全局注意机制图像描述方法。该方法在注意机制的基础上,通过设计全局特征网络来模拟人类感知机制的全过程,对图像全局特征进行增强。将所提方法在相同数据集和网... 针对现有基于注意机制的图像描述方法全局信息缺失问题,提出了一种改进的全局注意机制图像描述方法。该方法在注意机制的基础上,通过设计全局特征网络来模拟人类感知机制的全过程,对图像全局特征进行增强。将所提方法在相同数据集和网络超参数的情况下与目前最优网络进行实验对比,分析了全局信息对生成文本的影响。实验结果显示,文中提出的方法在更具挑战性的中文文本描述任务上客观评价指标优于目前最优的模型。同时,在主观评价中能够生成更准确的文本内容,也更具丰富性与多样性,接近自然语言描述。 展开更多
关键词 图像描述 注意机制 全局特征 卷积神经网络 循环神经网络
在线阅读 下载PDF
具有全局特征的空间注意力机制 被引量:11
20
作者 张连超 乔瑞萍 +2 位作者 党祺玮 翟沛源 孙红帅 《西安交通大学学报》 EI CAS CSCD 北大核心 2020年第11期129-138,共10页
为了获得卷积神经网络特征图中不同特征点之间的长距离依赖关系,使卷积神经网络更好地区分前景目标和背景信息,提出了一种具有全局特征的空间注意力机制。通过通道融合层将多通道的原始特征图组合成单通道的特征融合图,消除了通道间信... 为了获得卷积神经网络特征图中不同特征点之间的长距离依赖关系,使卷积神经网络更好地区分前景目标和背景信息,提出了一种具有全局特征的空间注意力机制。通过通道融合层将多通道的原始特征图组合成单通道的特征融合图,消除了通道间信息分布对获取空间注意力权重的影响;将特征融合图经过全局特征获取处理,获得能够反映特征融合图中某特征点与特征融合图中所有点之间相关性的全局特征图;全局特征图与初始值为0的可学习变量相乘,并且在通道域复制自身,扩展为原始特征图大小,将扩展后的全局特征图与原始特征图对应元素相加,获得具有注意力机制的特征图。在不同卷积神经网络中加入具有全局特征的空间注意力机制进行实验,结果表明:在脑电波二分类任务中,所提注意力机制的分类准确率最高提升了0.839%;在CIFAR-10数据集多分类任务中,所提注意力机制的分类准确率最高提升了0.484%;在夜间车辆单类别检测中,在交并比阈值大于0.5的平均精度评判标准下,所提注意力机制最高提升了3.860%,在交并比阈值大于0.75的平均精度评判标准下,所提注意力机制最高提升了11.726%;在voc2007数据集多类别检测中,在交并比阈值大于0.5的平均精度评判标准下,所提注意力机制最高提升了0.778%,在交并比阈值大于0.75的平均精度评判标准下,所提注意力机制最高提升了1.232%。 展开更多
关键词 卷积神经网络 空间注意机制 全局特征 特征融合 目标分类 目标检测
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部