期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于全局注意力机制的单像素成像图像增强方法 被引量:3
1
作者 刘辉 杨照华 +2 位作者 吴云 赵梓栋 余远金 《空间控制技术与应用》 CSCD 北大核心 2023年第6期68-76,共9页
单像素成像是一种仅需要使用无分辨能力的桶探测器结合空间光调制信息就能重构出一副完整图像的成像方式,具有非局域成像和高灵敏的特点,适合在外太空非合作目标下进行超远距离成像探测,但需要多次空间光调制后进行探测,重构图像信噪比... 单像素成像是一种仅需要使用无分辨能力的桶探测器结合空间光调制信息就能重构出一副完整图像的成像方式,具有非局域成像和高灵敏的特点,适合在外太空非合作目标下进行超远距离成像探测,但需要多次空间光调制后进行探测,重构图像信噪比低.本文提出一种基于全局注意力机制的低采样率下图像增强方法,利用Transformer结构搭建新型的SUNet(swin transformer unet)网络,解决传统卷积神经网络平移不变性和无法获得全局感受野的问题.根据切蛋糕(cake-cutting, CC)序改进的差分鬼成像算法在低采样条件下重构出低质量的图像,使用SUNet对图像进行增强.实验结果表明,该方法与2022年提出的GIDC(ghost imaging using deep neural network constraint)方法相比,在0.1的采样率下,峰值信噪比提升了3.29 dB,结构相似度提升了8%,为单像素成像的空间探测提供了新的技术途径. 展开更多
关键词 单像素成像 全局注意力机制 图像增强 空间探测
在线阅读 下载PDF
结合全局注意力机制的实时语义分割网络 被引量:5
2
作者 李涛 高志刚 +2 位作者 管晟媛 徐久成 马媛媛 《智能系统学报》 CSCD 北大核心 2023年第2期282-292,共11页
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s... 针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。 展开更多
关键词 实时语义分割 全局注意力机制 多尺度特征融合 混合空洞卷积 卷积神经网络 金字塔池化 感受野 特征提取
在线阅读 下载PDF
基于全局注意力机制和LSTM的连续手语识别算法 被引量:7
3
作者 杨观赐 韩海峰 +2 位作者 刘赛赛 蒋亚汶 李杨 《包装工程》 CAS 北大核心 2022年第8期28-34,共7页
目的 为提高连续手语识别准确率,缓解听障人群与非听障人群的沟通障碍。方法 提出了基于全局注意力机制和LSTM的连续手语识别算法。通过帧间差分法对视频数据进行预处理,消除视频冗余帧,借助ResNet网络提取特征序列。通过注意力机制加权... 目的 为提高连续手语识别准确率,缓解听障人群与非听障人群的沟通障碍。方法 提出了基于全局注意力机制和LSTM的连续手语识别算法。通过帧间差分法对视频数据进行预处理,消除视频冗余帧,借助ResNet网络提取特征序列。通过注意力机制加权,获得全局手语状态特征,并利用LSTM进行时序分析,形成一种基于全局注意力机制和LSTM的连续手语识别算法,实现连续手语识别。结果 实验结果表明,该算法在中文连续手语数据集CSL上的平均识别率为90.08%,平均词错误率为41.2%,与5种算法相比,该方法在识别准确率与翻译性能上具有优势。结论 基于全局注意力机制和LSTM的连续手语识别算法实现了连续手语识别,并且具有较好的识别效果及翻译性能,对促进听障人群无障碍融入社会方面具有积极的意义。 展开更多
关键词 手语识别 特征提取 全局注意力机制 LSTM
在线阅读 下载PDF
多尺度残差与全局注意力结合的低剂量CT去噪
4
作者 孙亚楠 陈平 潘晋孝 《应用光学》 北大核心 2025年第2期292-299,共8页
针对目前低剂量CT(low dose computed tomography,LDCT)图像去噪方法由于缺乏对空间特征和去噪任务之间的内在联系,导致重建图像的纹理细节丢失和过于平滑的问题,提出了一种结合多尺度密集残差和全局注意力的图像去噪网络。通过引入多... 针对目前低剂量CT(low dose computed tomography,LDCT)图像去噪方法由于缺乏对空间特征和去噪任务之间的内在联系,导致重建图像的纹理细节丢失和过于平滑的问题,提出了一种结合多尺度密集残差和全局注意力的图像去噪网络。通过引入多尺度密集残差块来提取图像的多尺度特征信息,并通过全局注意力机制(global attention mechanism,GAM)来关注模型不同通道间的跨维信息,同时加入跳跃连接进一步扩大全局交互特征的范围,最后使用多尺度特征损失函数增强图像纹理细节,避免图像过于平滑的问题。经过实验验证,本文所提出的算法在峰值信噪比(PSNR)和结构相似度(SSIM)这两项指标上分别达到了35.1838 dB、0.9605,在去除噪声的同时很好地保留了图像细节信息,优于其他算法。 展开更多
关键词 低剂量CT 图像去噪 多尺度密集残差 全局注意力机制
在线阅读 下载PDF
双向建模增强TKAN和全局注意力机制融合的滚动轴承剩余寿命预测
5
作者 姜蕾 郑建飞 +3 位作者 胡昌华 赵瑞星 韩其辉 杨立浩 《自动化学报》 2025年第8期1857-1868,共12页
滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键.针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题,提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺... 滚动轴承剩余使用寿命(RUL)的精准预测是确保设备或系统安全可靠运行的关键.针对滚动轴承RUL预测中多维退化特征的长期依赖关系难以有效建模的问题,提出一种双向时间序列建模与注意力机制融合的预测模型——双向时序科尔莫戈洛夫−阿诺尔德注意力网络(Bi-TKAN-Att).该模型兼具了时序科尔莫戈洛夫−阿诺尔德网络的强时序建模能力和全局注意力机制的关键特征提取能力,采用双向建模的方式捕捉前后向信息,最终实现了具有长期依赖多维退化特征的滚动轴承RUL预测.所提方法在滚动轴承数据集上进行实验验证,结果表明Bi-TKAN-Att模型在捕获滚动轴承退化特性和提升RUL预测精度方面具有显著优势,并通过消融实验证明了模型各组件的合理性和有效性,为滚动轴承的寿命预测提供了全新可行的解决方案. 展开更多
关键词 剩余使用寿命预测 滚动轴承 时序科尔莫戈洛夫-阿诺尔德网络 双向建模 全局注意力机制
在线阅读 下载PDF
SG-UNet:基于全局注意力和自校准卷积增强的黑色素瘤分割模型
6
作者 计寰宇 王蕊 +1 位作者 高盛祥 车文刚 《南方医科大学学报》 北大核心 2025年第6期1317-1326,共10页
目的 提出了一种新的黑色素瘤分割模型SG-UNet,以提高黑色素瘤皮肤镜图像的精确分割。通过分割后边界特征评估,可以更准确地识别诊断黑色素瘤从而辅助早期诊断。方法 使用一种U形结构的卷积神经网络UNet,对其主干、跳跃连接和下采样池... 目的 提出了一种新的黑色素瘤分割模型SG-UNet,以提高黑色素瘤皮肤镜图像的精确分割。通过分割后边界特征评估,可以更准确地识别诊断黑色素瘤从而辅助早期诊断。方法 使用一种U形结构的卷积神经网络UNet,对其主干、跳跃连接和下采样池化部分进行改进。在主干部分,我们将UNet的下采样部分参考Vgg的结构将卷积数量由10个增加到13个加深网络层次来捕获更加精细的特征表示。为了进一步提升特征提取和细节识别的能力,主干部分将传统的卷积替换为自校准卷积增强模型对空间维度和通道维度特征的捕获能力。同时,在池化部分将哈尔小波下采样替换原有的池化层实现更有效的多尺度特征融合,并降低特征图的空间分辨率。接着将全局注意力机制融入到每一层的跳跃连接中更好地理解图像的上下文信息。结果实验结果表明SG-UNet在ISIC 2017和ISIC 2018数据集上的分割效果对比目前其他先进分割模型得到明显提升。在ISIC2017和ISIC 2018数据集上Dice,IoU分别达到了92.41%,86.62%和92.31%,86.48%。结论 实验结果证实,所提出的方法能够有效实现黑色素瘤的精确分割。 展开更多
关键词 图像分割 全局注意力机制 黑色素瘤 UNet 自校准卷积 哈尔小波下采样 SG-UNet
在线阅读 下载PDF
基于全局注意力卷积神经网络的刀具磨损预测
7
作者 金坚 卢文壮 +1 位作者 吴超逸 徐洛 《工具技术》 北大核心 2025年第7期134-138,共5页
刀具磨损状态的精准预测对于提高加工质量和加工效率有着重要意义,基于传统CNN的刀具磨损预测模型未考虑特征信息之间的交互汇聚,预测精度存在局限。针对此问题,本文提出一种基于全局注意力卷积神经网络(GAM-CNN)的刀具磨损预测模型。... 刀具磨损状态的精准预测对于提高加工质量和加工效率有着重要意义,基于传统CNN的刀具磨损预测模型未考虑特征信息之间的交互汇聚,预测精度存在局限。针对此问题,本文提出一种基于全局注意力卷积神经网络(GAM-CNN)的刀具磨损预测模型。该刀具磨损预测模型在卷积神经网络基础上添加全局注意力机制,该机制通过通道和空间双注意力将卷积神经网络提取到的特征进行加权汇聚,更好地突出重要特征并与预测值进行关联。预测实验结果表明,该预测模型的MAE为13.83μm、RMSE为17.33μm、MAPE为12.58%,均优于对比的未含全局注意力机制的CNN、CAM-CNN以及PSO-SVR模型。 展开更多
关键词 刀具磨损 预测 全局注意力机制 卷积神经网络
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法
8
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-Transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
融合基序信息的图同构注意力网络的图分类问题研究
9
作者 衡红军 曹莹莹 《小型微型计算机系统》 北大核心 2025年第3期552-558,共7页
基于频繁子图挖掘算法的图分类方法无法避免子图同构计算,算法的效率低且忽略了节点特征信息,而基于图神经网络的方法则关注节点特征信息.本文提出一种融合基序信息的图同构注意力网络的图分类方法.该方法首先利用图的拓扑结构和节点类... 基于频繁子图挖掘算法的图分类方法无法避免子图同构计算,算法的效率低且忽略了节点特征信息,而基于图神经网络的方法则关注节点特征信息.本文提出一种融合基序信息的图同构注意力网络的图分类方法.该方法首先利用图的拓扑结构和节点类别信息,提取数据集中的子图结构构成基序集合,再基于基序集合生成基序级图嵌入表示,避免了频繁子图挖掘;然后在图同构网络的池化操作中引入全局注意力机制,学习高质量的节点级图嵌入表示;最后将基序级和节点级图嵌入表示拼接起来用于图分类.该图嵌入表示不仅包含了图中节点的特征信息,也反映了图的结构特征信息.实验结果表明,所构建的网络模型在五个公开数据集上取得了优异的分类精度. 展开更多
关键词 图分类 图神经网络 基序 全局注意力机制
在线阅读 下载PDF
融合动态场景感知和注意力机制的声学回声消除算法
10
作者 许春冬 黄乔月 +1 位作者 王磊 徐锦武 《信号处理》 CSCD 北大核心 2024年第2期396-405,共10页
在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统... 在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统回声消除系统存在去回声效果不明显、存在非线性回声残留以及无法实时处理回声等问题。因此,为解决上述存在问题,提出了一种动态场景感知模块(Dynamic scene perception module,DSPM)和全局注意力机制(Global attention mechanism,GAM)相结合的声学回声消除算法。该算法以卷积循环网络(Convolutional recurrent network,CRN)作为基线模型,提取语音信号的序列特征;首先,在其编码器中引入DSPM模块替换原因果卷积,根据场景动态分配卷积内核数量,加强模型的自适应性;其次,在编码器最后两层中分别引入GAM模块,放大空间通道间关系以及统筹全局交互,提升对语音信号特征的提取能力以及消除回声的性能;最后,通过将MSE损失函数和HuberLoss损失函数线性相加生成一种新的损失函数——MSE-HuberLoss,进一步提高模型的鲁棒性。实验结果表明,提出的GAM-DSPM-CRN模型的回声消除性能优秀,且获得较基线模型更加清晰的重构语音信号;在双端通话环境下,提出的GAM-DSPM-CRN模型声学回声消除算法较其他对比算法性能有较大提升;在Microsoft AEC Challenges数据集上,MOS、ERLE和STOI的得分分别达到了4.09、57.43和0.78。 展开更多
关键词 声学回声消除 动态场景感知模块 全局注意力机制 卷积循环网络 联合损失函数
在线阅读 下载PDF
基于全局注意力的Gam-EEGNet在SSVEP分类中的应用 被引量:2
11
作者 刘俊杰 谢俊 +1 位作者 王虎 胡博 《电子测量技术》 北大核心 2024年第22期76-83,共8页
稳态视觉诱发电位(SSVEP)作为脑机接口(BCI)系统中的重要信号类型,因其高稳定性和易操作性而广泛应用于BCI研究。在过去的研究中,已有许多方法在SSVEP信号分类中取得了显著进展,但依然面临着信噪比低、信号非平稳性和个体差异大的挑战... 稳态视觉诱发电位(SSVEP)作为脑机接口(BCI)系统中的重要信号类型,因其高稳定性和易操作性而广泛应用于BCI研究。在过去的研究中,已有许多方法在SSVEP信号分类中取得了显著进展,但依然面临着信噪比低、信号非平稳性和个体差异大的挑战。为进一步提升SSVEP分类的准确性和实用性,本文提出了一种结合全局注意力机制与紧凑脑电网络(EEGNet)的新型神经网络架构——Gam-EEGNet。EEGNet作为一种紧凑、高效且适应性强的基础模型,在SSVEP信号处理中具有重要作用。通过在EEGNet中引入全局注意力机制,Gam-EEGNet能够更精确地提取和表征SSVEP信号特征,从而有效降低个体差异和噪声的影响。实验采用了涵盖12种不同频率的SSVEP脑电数据,并将Gam-EEGNet与典型卷积神经网络(CCNN)、滤波器组-时间卷积神经网络(FB-tCNN)和滤波器组-时间卷积神经网络(SSVEPNet)等主流深度学习方法进行了分类性能对比。结果表明,Gam-EEGNet在不同时间窗口下的分类准确率和信息传输率(ITR)均优于其他方法,特别是在0.7 s的短时间窗口内,分类精度达到86.58%;在1 s时间窗内,多名被试者的平均识别准确率超过95%,ITR超过189 bits/min。此外,Gam-EEGNet在训练过程中表现出更好的收敛性和稳定性,具有更快的收敛速度和更低的训练误差。这些结果表明,Gam-EEGNet在SSVEP信号分类中展现出显著的性能提升,尤其适用于实时BCI系统中的快速响应场景,具有广泛的应用潜力。 展开更多
关键词 深度学习 脑-机接口 稳态视觉诱发电位 全局注意力机制 Gam-EEGNet模型
在线阅读 下载PDF
融合全局上下文注意力的遥感图像检测方法
12
作者 廖欢 朱文球 +1 位作者 雷源毅 徐轲 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第2期278-283,共6页
针对遥感图像场景复杂、目标尺寸不一、且小尺寸目标过多导致的检测精度不佳和出现漏检等问题,提出了一种融合全局上下文注意力的目标检测算法。该算法提出一种全局上下文注意力机制和YOLOv5中C3结构融合的模块,以提升网络捕捉图像全局... 针对遥感图像场景复杂、目标尺寸不一、且小尺寸目标过多导致的检测精度不佳和出现漏检等问题,提出了一种融合全局上下文注意力的目标检测算法。该算法提出一种全局上下文注意力机制和YOLOv5中C3结构融合的模块,以提升网络捕捉图像全局特征的能力;通过Varifocal Loss损失函数来提升对密集、尺寸小的目标的检测性能;采用基于归一化的注意力模块,降低图像中不太显著的特征和权重,使网络能够达到更高的检测准确率;利用动态卷积学习各个维度的信息,让训练得到的模型在降低GFLOPs情况下,同时保持检测精度提升。在NWPU VHR-10数据集上实验结果mAP为96.0%、准确率为98.2%、召回率为94.9%,较原YOLOv5模型分别提升了1.8%、4.7%和2.2%,证明了所改进YOLOv5方法的有效性。 展开更多
关键词 YOLOv5 遥感图像 Varifocal Loss 全局上下文注意力机制 动态卷积
在线阅读 下载PDF
基于三目注意力机制的高效轻量化麦穗检测算法
13
作者 董燕 刘运东 +2 位作者 李卫杰 刘洲峰 李春雷 《计算机工程与设计》 北大核心 2023年第7期2062-2069,共8页
针对复杂大田环境下基于卷积神经网络的麦穗检测方法实时性差、检测精度低的问题,提出一种基于三目注意力机制的高效轻量化麦穗检测算法。采用MobileNetV3作为主干网络对特征进行高效提取;通过融合通道、空间和位置的特征信息设计三目... 针对复杂大田环境下基于卷积神经网络的麦穗检测方法实时性差、检测精度低的问题,提出一种基于三目注意力机制的高效轻量化麦穗检测算法。采用MobileNetV3作为主干网络对特征进行高效提取;通过融合通道、空间和位置的特征信息设计三目注意力机制,提升模型对关键特征的敏感度;基于条件卷积设计全局多头自注意力机制,增强全局特征的提取能力;选择CIOU作为边框回归损失函数,增强遮挡及重叠目标的检测效果。实验结果表明,与其它优秀的算法相比,所提算法在减少模型容量的同时,提升了检测精度和速度。 展开更多
关键词 复杂场景 麦穗检测 深度学习 轻量化 三目注意力机制 全局多头自注意力机制 条件卷积
在线阅读 下载PDF
跨模态交互融合与全局感知的RGB-D显著性目标检测 被引量:1
14
作者 孙福明 胡锡航 +2 位作者 武景宇 孙静 王法胜 《软件学报》 EI CSCD 北大核心 2024年第4期1899-1913,共15页
近年来,RGB-D显著性检测方法凭借深度图中丰富的几何结构和空间位置信息,取得了比RGB显著性检测模型更好的性能,受到学术界的高度关注.然而,现有的RGB-D检测模型仍面临着持续提升检测性能的需求.最近兴起的Transformer擅长建模全局信息... 近年来,RGB-D显著性检测方法凭借深度图中丰富的几何结构和空间位置信息,取得了比RGB显著性检测模型更好的性能,受到学术界的高度关注.然而,现有的RGB-D检测模型仍面临着持续提升检测性能的需求.最近兴起的Transformer擅长建模全局信息,而卷积神经网络(CNN)擅长提取局部细节.因此,如何有效结合CNN和Transformer两者的优势,挖掘全局和局部信息,将有助于提升显著性目标检测的精度.为此,提出一种基于跨模态交互融合与全局感知的RGB-D显著性目标检测方法,通过将Transformer网络嵌入U-Net中,从而将全局注意力机制与局部卷积结合在一起,能够更好地对特征进行提取.首先借助U-Net编码-解码结构,高效地提取多层次互补特征并逐级解码生成显著特征图.然后,使用Transformer模块学习高级特征间的全局依赖关系增强特征表示,并针对输入采用渐进上采样融合策略以减少噪声信息的引入.其次,为了减轻低质量深度图带来的负面影响,设计一个跨模态交互融合模块以实现跨模态特征融合.最后,5个基准数据集上的实验结果表明,所提算法与其他最新的算法相比具有显著优势. 展开更多
关键词 显著性目标检测 跨模态 全局注意力机制 RGB-D检测模型
在线阅读 下载PDF
改进ConvNeXt V2的岩石薄片岩性识别方法
15
作者 王婷婷 蒋静怡 +2 位作者 赵万春 秦依凡 李廷礼 《石油地球物理勘探》 北大核心 2025年第2期292-301,共10页
在油气勘探领域,通过岩石微观结构可知油气资源的赋存状态,其精度和效率的提高依赖于有效的岩性识别方法。为此,提出了一种改进ConvNeXt V2的岩石薄片岩性识别方法。首先,以ConvNeXt V2-T为核心特征提取网络,嵌入全局注意力机制,提升对... 在油气勘探领域,通过岩石微观结构可知油气资源的赋存状态,其精度和效率的提高依赖于有效的岩性识别方法。为此,提出了一种改进ConvNeXt V2的岩石薄片岩性识别方法。首先,以ConvNeXt V2-T为核心特征提取网络,嵌入全局注意力机制,提升对全局特征的感知能力;然后,设计多尺度特征融合模块,可以在不同尺度上对特征图进行有效融合;最后,使用Lion优化器代替原本的AdamW优化器以改进模型优化器,从而使速度更快、能够取得更好的泛化性能且更省内存。实验结果表明,该方法准确率、精确率、召回率、特异度及F1值平均值分别为96.1%、95.5%、96.2%、99.1%、95.8%;改进后的算法收敛速度更快,准确性更高,可以实现岩石薄片图像的精准分类和识别。 展开更多
关键词 岩性识别 ConvNeXt V2 全局注意力机制 多尺度特征融合 Lion优化器
在线阅读 下载PDF
改进CycleGAN的半监督建筑物提取算法
16
作者 卢鹏 仲闯 《计算机工程》 北大核心 2025年第3期241-251,共11页
建筑物提取需要大量的标注数据进行训练,收集和标注数据需要耗费大量时间。为了在小样本遥感图像数据集上基于半监督学习实现建筑物提取的目的,构建4组建筑物提取数据集,提出了一种基于循环一致性生成对抗网络(CycleGAN)的建筑物提取算... 建筑物提取需要大量的标注数据进行训练,收集和标注数据需要耗费大量时间。为了在小样本遥感图像数据集上基于半监督学习实现建筑物提取的目的,构建4组建筑物提取数据集,提出了一种基于循环一致性生成对抗网络(CycleGAN)的建筑物提取算法。首先,在生成器中引入全局注意力机制(GAM)以增强对建筑物和图像背景细节特征的区分;其次,在判别器中加入谱归一化层以增强训练稳定性,解决了训练过程中梯度消失问题;最后,改进对抗损失和循环一致性损失以提高生成图像的质量,避免生成图像的过度平滑化,并引入Identity损失以限制生成器不会自主修改输入图像的颜色,保证输入图像与输出图像颜色组成的一致性。实验结果表明,在第1组小样本数据集上,与UNIT、MUNIT、U-GAT-IT、SPatchGAN、QS-Attn模型进行半监督实验对比,结构相似性(SSIM)值和准确率分别至少提高了3、8.1百分点,在扩充数据规模的数据集上,使用改进后的算法进行全监督和半监督实验对比,验证了改进后的算法在小样本遥感图像数据集上实现建筑物半监督提取的有效性。 展开更多
关键词 建筑物提取 循环一致性生成对抗网络 谱归一化 全局注意力机制 半监督
在线阅读 下载PDF
融合多源评价数据的荔枝果期表型特征评估
17
作者 陆健强 袁家俊 +4 位作者 余超然 王卫星 牛宏宇 兰玉彬 谭扬奕 《农业机械学报》 北大核心 2025年第3期91-100,共10页
人工智能技术在荔枝表型获取方面的研究目前主要集中于对象识别、产量预估和采摘定位等,对荔枝完整果期生长质量的评价技术较为缺乏。本研究通过融合多源数据指标,对荔枝果期生长质量进行综合评估,生成荔枝果期评价画像。基于YOLO v7网... 人工智能技术在荔枝表型获取方面的研究目前主要集中于对象识别、产量预估和采摘定位等,对荔枝完整果期生长质量的评价技术较为缺乏。本研究通过融合多源数据指标,对荔枝果期生长质量进行综合评估,生成荔枝果期评价画像。基于YOLO v7网络框架提出果实识别算法LFS-YOLO,通过减少由动态环境背景引起的误差和影响,集成全局注意力能力,提升全景图像识别的准确性。其次,通过优化CIoU损失函数,添加考虑预期回归向量之间的角度,重新定义并改进角度惩罚测度以减少整体自由度,将预测框更有效地对齐到最近的轴上。通过融合多源数据,建立质量评估函数,为综合评价提供依据。试验结果表明,LFS-YOLO对果实识别精度达到89.1%,精确率为92.3%,召回率为93.0%,且生成的荔枝果期表型特征评估方法可显示荔枝果期影响生长质量各项指标,为荔枝果期综合评价发展提供启示作用。 展开更多
关键词 荔枝 表型特征评估 YOLO v7 全局注意力机制 综合评价 气象数据
在线阅读 下载PDF
不平衡数据下面向包粒度应用层负载的轻量化入侵检测模型
18
作者 杨毅铭 陈世平 《小型微型计算机系统》 北大核心 2025年第2期465-473,共9页
网络入侵检测是一种重要的网络安全方案.目前网络入侵检测模型都有较高精确度,但是模型复杂,参数量和计算量较大.针对该问题,设计了一种新的基于包粒度应用层负载的网络入侵检测一维卷积轻量模型.本文首先对UNSWNB15数据集的原始流量文... 网络入侵检测是一种重要的网络安全方案.目前网络入侵检测模型都有较高精确度,但是模型复杂,参数量和计算量较大.针对该问题,设计了一种新的基于包粒度应用层负载的网络入侵检测一维卷积轻量模型.本文首先对UNSWNB15数据集的原始流量文件进行包粒度应用层负载数据提取,构造一维灰度特征向量.在此基础上,本文提出一种由新的一维深度可分离卷积残差模块组成,融入了全局上下文注意力机制(Global Context Attention Module)的一维卷积轻量模型Fast Payload,并进行了针对性的模型优化和可行性论证.Fast Payload模型在UNSWNB15数据集上的9分类任务中宏平均准确率达到82.433%,加权平均精确率达到90.820%,均高于对比模型;同时,该模型计算量和参数量均低于对比模型.其次本文提出了二阶段类别平衡损失函数GHM2StageLoss,有效解决了数据集的类别不平衡问题,相比其他类别平衡损失函数,效果更好.为方便后续研究的复现,本研究开源部分源代码,网址为https://github.com/sadantange/FastPayload. 展开更多
关键词 入侵检测 一维卷积神经网络 深度可分离卷积 全局上下文注意力机制 类别平衡
在线阅读 下载PDF
基于双曲嵌入的露天矿区暗光环境下道路多目标检测模型 被引量:1
19
作者 顾清华 苏存玲 +2 位作者 王倩 陈露 熊乃学 《工矿自动化》 CSCD 北大核心 2024年第1期49-56,114,共9页
露天矿环境特殊,道路场景复杂多变,在光照不足时会导致矿区道路多目标识别不清、定位不准,进而影响检测效果,给矿区无人矿用卡车的安全行驶带来严重安全隐患。目前的道路障碍物检测模型不能有效解决矿区暗光环境对模型检测效果的影响,... 露天矿环境特殊,道路场景复杂多变,在光照不足时会导致矿区道路多目标识别不清、定位不准,进而影响检测效果,给矿区无人矿用卡车的安全行驶带来严重安全隐患。目前的道路障碍物检测模型不能有效解决矿区暗光环境对模型检测效果的影响,同时对矿区小目标障碍物的识别也有较大误差,不适用于矿区特殊环境下障碍物的检测与识别。针对上述问题,提出了一种基于双曲嵌入的露天矿区暗光环境下多目标检测模型。首先,在模型的图像预处理阶段引入卷积神经网路Retinex-Net对暗图像进行增强,提高图像清晰度;然后,针对数据集中特征过多而无重点偏好的问题,在加强特征提取部分添加全局注意力机制,聚集3个维度上更关键的特征信息;最后,在检测模型预测阶段引入双曲全连接层,以减少特征丢失,并防止过拟合现象。实验结果表明:(1)基于双曲嵌入的露天矿区暗光环境下道路多目标检测模型不仅对露天矿区暗光环境下的大尺度目标具有较高的分类与定位精度,对矿用卡车及较远距离的小尺度目标即行人也可准确检测与定位,能够满足无人矿用卡车在矿区特殊环境下驾驶的安全需求。(2)模型的检测准确率达98.6%,检测速度为51.52帧/s,较SSD、YOLOv4、YOLOv5、YOLOx、YOLOv7分别提高20.31%,18.51%,10.53%,8.39%,13.24%,对于矿区道路上的行人、矿用卡车及挖机的检测精度达97%以上。 展开更多
关键词 露天矿 自动驾驶 无人矿用卡车 暗光环境 多目标检测 小目标障碍物 全局注意力机制 双曲全连接层
在线阅读 下载PDF
基于改进YOLOv5s的道路裂缝检测算法 被引量:7
20
作者 任安虎 姜子渊 马晨浩 《激光杂志》 CAS 北大核心 2024年第4期88-94,共7页
为了解决道路巡检系统光学传感器采集的裂缝图像中颜色特征不明显且尺寸不规则造成检测精度不高、泛化能力不足的问题,提出改进YOLOv5s的裂缝检测算法。将结合深度可分离卷积(Depthwise Separable Convolution, DSC)的全局注意力(Global... 为了解决道路巡检系统光学传感器采集的裂缝图像中颜色特征不明显且尺寸不规则造成检测精度不高、泛化能力不足的问题,提出改进YOLOv5s的裂缝检测算法。将结合深度可分离卷积(Depthwise Separable Convolution, DSC)的全局注意力(Global Attention Mechanism, GAM)引入主干特征提取网络,在降低注意力复杂度的同时获得丰富的跨维度特征,增强了裂缝的识别能力;采用空间金字塔软池化网络(Spatial Pyramid Softpool, SPSF),通过Softpool池化保留多维语义以减少信息弥散,提高了边界框回归的准确性;在颈部特征增强网络,运用空洞深度可分离卷积(Atrous DSC)进行下采样,通过扩大感受野加强深层和浅层信息的聚合能力,提高裂缝识别的泛化性。经过在自制道路裂缝数据集上的实验,相较于YOLOv5s,改进算法的mAP提高2.2%,有效提升了道路裂缝检测的准确性和对不同背景下裂缝识别的泛化能力。 展开更多
关键词 道路裂缝检测 YOLOv5s算法 全局注意力机制 深度可分离卷积 Softpool池化
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部