期刊文献+
共找到84,410篇文章
< 1 2 250 >
每页显示 20 50 100
基于Transformer模型的时序数据预测方法综述 被引量:7
1
作者 孟祥福 石皓源 《计算机科学与探索》 北大核心 2025年第1期45-64,共20页
时序数据预测(TSF)是指通过分析历史数据的趋势性、季节性等潜在信息,预测未来时间点或时间段的数值和趋势。时序数据由传感器生成,在金融、医疗、能源、交通、气象等众多领域都发挥着重要作用。随着物联网传感器的发展,海量的时序数据... 时序数据预测(TSF)是指通过分析历史数据的趋势性、季节性等潜在信息,预测未来时间点或时间段的数值和趋势。时序数据由传感器生成,在金融、医疗、能源、交通、气象等众多领域都发挥着重要作用。随着物联网传感器的发展,海量的时序数据难以使用传统的机器学习解决,而Transformer在自然语言处理和计算机视觉等领域的诸多任务表现优秀,学者们利用Transformer模型有效捕获长期依赖关系,使得时序数据预测任务取得了飞速发展。综述了基于Transformer模型的时序数据预测方法,按时间梳理了时序数据预测的发展进程,系统介绍了时序数据预处理过程和方法,介绍了常用的时序预测评价指标和数据集。以算法框架为研究内容系统阐述了基于Transformer的各类模型在TSF任务中的应用方法和工作原理。通过实验对比了各个模型的性能、优点和局限性,并对实验结果展开了分析与讨论。结合Transformer模型在时序数据预测任务中现有工作存在的挑战提出了该方向未来发展趋势。 展开更多
关键词 深度学习 时序数据预测 数据预处理 transformer模型
在线阅读 下载PDF
基于Transformer的时间序列预测方法综述 被引量:1
2
作者 陈嘉俊 刘波 +2 位作者 林伟伟 郑剑文 谢家晨 《计算机科学》 北大核心 2025年第6期96-105,共10页
时间序列预测作为分析历史数据以预测未来趋势的关键技术,已广泛应用于金融、气象等领域。然而,传统方法如自回归移动平均模型和指数平滑法等在处理非线性模式、捕捉长期依赖性时存在局限。最近,基于Transformer的方法因其自注意力机制... 时间序列预测作为分析历史数据以预测未来趋势的关键技术,已广泛应用于金融、气象等领域。然而,传统方法如自回归移动平均模型和指数平滑法等在处理非线性模式、捕捉长期依赖性时存在局限。最近,基于Transformer的方法因其自注意力机制,在自然语言处理与计算机视觉领域取得突破,也开始拓展至时间序列预测领域并取得显著成果。因此,探究如何将Transformer高效运用于时间序列预测,成为推动该领域发展的关键。首先,介绍了时间序列的特性,阐述了时间序列预测的常见任务类别及评估指标。接着,深入解析Transformer的基本架构,并挑选了近年来在时间序列预测中广受关注的Transfo-rmer衍生模型,从模块及架构层面进行分类,并分别从问题解决、创新点及局限性3个维度进行比较和分析。最后,进一步探讨了时间序列预测Transformer在未来可能的研究方向。 展开更多
关键词 时间序列 transformer模型 深度学习 注意力机制 预测
在线阅读 下载PDF
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
3
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 transformER 注意力模块 梯度融合
在线阅读 下载PDF
多尺度特征提取的Transformer短期风电功率预测 被引量:2
4
作者 徐武 范鑫豪 +1 位作者 沈智方 刘洋 《太阳能学报》 北大核心 2025年第2期640-648,共9页
针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了... 针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了特征提取时维数不被破坏;其次,利用融合自注意力机制的长短期记忆网络挖掘气象条件与功率之间的全局依赖关系;最后,融合风电功率序列本身时序特征和气象条件依赖关系,实现短期风电功率预测。实例仿真结果表明,MTPNet模型预测精度得到提升;消融实验证明了模型各模块的可靠性和有效性,具有一定的实用价值。 展开更多
关键词 风电功率预测 transformER 注意力机制 特征提取 长短期记忆网络 维数不变嵌入层
在线阅读 下载PDF
双向自回归Transformer与快速傅里叶卷积增强的壁画修复 被引量:1
5
作者 陈永 张世龙 杜婉君 《湖南大学学报(自然科学版)》 北大核心 2025年第4期1-15,共15页
针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer... 针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer结构的全局语义特征修复模块,利用双向自回归机制与掩码语言模型(masked language modeling,MLM),提出改进的多头注意力全局语义壁画修复模块,提高对全局语义特征的修复能力.然后,构建了由门控卷积和残差模块组成的全局语义增强模块,增强全局语义特征一致性约束.最后,设计局部细节修复模块,采用大核注意力机制(large kernel attention,LKA)与快速傅里叶卷积提高细节特征的捕获能力,同时减少局部细节信息的丢失,提升修复壁画局部和整体特征的一致性.通过对敦煌壁画数字化修复实验,结果表明,所提算法修复性能更优,客观评价指标均优于比较算法. 展开更多
关键词 壁画修复 双向自回归transformer 掩码语言模型 快速傅里叶卷积 语义增强
在线阅读 下载PDF
基于卷积和Transformer神经网络架构搜索的脑胶质瘤多组织分割网络 被引量:1
6
作者 陶永鹏 柏诗淇 周正文 《计算机应用》 北大核心 2025年第7期2378-2386,共9页
脑胶质瘤在磁共振成像(MRI)图像中的形状大小变化大、边界模糊且组织结构复杂,这些特点导致了脑肿瘤分割任务的挑战性,通常这种任务需要具备深厚专业知识的研究人员设计复杂定制的网络模型才能完成。这一过程不仅耗时,而且需要大量的人... 脑胶质瘤在磁共振成像(MRI)图像中的形状大小变化大、边界模糊且组织结构复杂,这些特点导致了脑肿瘤分割任务的挑战性,通常这种任务需要具备深厚专业知识的研究人员设计复杂定制的网络模型才能完成。这一过程不仅耗时,而且需要大量的人力资源。为了简化网络设计流程并自动获取最优的网络结构,提出一种基于卷积和Transformer神经网络架构搜索的脑胶质瘤多组织分割网络(NASCT-Net),以在构建用于多模态MRI脑肿瘤分割的网络架构的过程中,提高分割的精确度。首先,将神经架构搜索(NAS)技术应用于编码器的构建,形成可堆叠的NAS编解码模块,以自动优化适用于脑胶质瘤精准分割的网络架构;其次,在编码器底层集成基于Transformer的特征编码模块,以增强对肿瘤各组之间的相对位置和全局信息的表征能力;最后,通过构建体积加权Dice损失函数(VWDiceLoss),解决前景与背景的不平衡问题。在BraTS2019脑肿瘤数据集上与Swin-Unet等方法进行比较的实验结果表明,NASCT-Net的平均Dice相似系数(DSC)提高了0.009,同时平均Hausdorff距离(HD)降低了1.831 mm,验证了NASCT-Net在提高脑肿瘤多组织分割精度方面的有效性。 展开更多
关键词 网络架构 神经网络架构搜索 脑肿瘤分割 卷积神经网络 transformER
在线阅读 下载PDF
基于融合卷积Transformer的航空发动机故障诊断 被引量:1
7
作者 赵洪利 杨佳强 《北京航空航天大学学报》 北大核心 2025年第4期1117-1126,共10页
航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊... 航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊断方法。利用自注意力机制提取有用特征,抑制冗余信息,并将最大池化层引入Transformer模型中,进一步降低模型内存消耗及参数量,缓解过拟合现象。采用基于GasTurb建模的涡扇发动机仿真数据集进行验证,结果与Transformer模型和反向传播(BP)神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等传统深度学习模型相比,准确率分别提高了6.552%和28.117%、13.189%、10.29%,证明了所提方法的有效性,可为航空发动机故障诊断提供一定的参考。 展开更多
关键词 航空发动机 故障诊断 自注意力机制 融合卷积transformer 深度神经网络
在线阅读 下载PDF
基于CNN-BiLSTM-Transformer的舰船中压直流全电推进系统故障诊断设计
8
作者 张建良 韩涛 季瑞松 《实验技术与管理》 北大核心 2025年第1期11-18,共8页
针对舰船中压直流全电推进系统结构复杂度高、单元耦合性强、运行环境多变等特点造成的故障诊断准确性低和实时性差等问题,开展了基于CNN-BiLSTM-Transformer的故障诊断设计。首先,基于卷积神经网络CNN构建单点特征级联网络,开展单一时... 针对舰船中压直流全电推进系统结构复杂度高、单元耦合性强、运行环境多变等特点造成的故障诊断准确性低和实时性差等问题,开展了基于CNN-BiLSTM-Transformer的故障诊断设计。首先,基于卷积神经网络CNN构建单点特征级联网络,开展单一时刻下故障信号空间特征的深入提取,以提升故障特征提取的有效性;其次,以双向长短期记忆网络BiLSTM为核心设计多点特征依赖网络,利用门控机制和双向时序学习机制,实现故障信号在多个时刻之间特征依赖关系的有效学习,以提升故障诊断的准确性;然后,以Transformer为核心建立序列特征并行处理网络,通过自注意力机制实现对故障特征上下文关系的精确刻画,进而利用多头注意力机制实现特征序列的并行处理,以提升故障诊断的实时性;最后,设计舰船中压直流全电推进系统故障诊断实验方案,并开展不同故障模式下的诊断性能评估。该文方法在多种故障模式下诊断准确率和实时性均优于现有的主流故障诊断方法,有助于为舰船中压直流全电推进系统的安全运行提供更有力的技术保障。 展开更多
关键词 舰船 中压直流 全电推进系统 故障诊断 transformER
在线阅读 下载PDF
基于改进Transformer结构的电力绝缘子运动模糊图像复原网络
9
作者 李鹏 常乐 +2 位作者 覃发富 孟庆伟 陈继明 《电网技术》 北大核心 2025年第6期2623-2631,I0143-I0146,共13页
针对高压输电线路巡检航拍过程中产生的电力绝缘子图像运动模糊的失真情形,影响后续绝缘子定位及缺陷检测的问题,提出了一种基于改进Transformer结构的电力绝缘子图像运动模糊复原方法。为了适应电力绝缘子航拍图像中全局与局部模糊的... 针对高压输电线路巡检航拍过程中产生的电力绝缘子图像运动模糊的失真情形,影响后续绝缘子定位及缺陷检测的问题,提出了一种基于改进Transformer结构的电力绝缘子图像运动模糊复原方法。为了适应电力绝缘子航拍图像中全局与局部模糊的复原需求,在Transformer网络结构上引入条带注意力模块,结合卷积神经网络,在减小内存空间需求和不依赖大量训练数据的同时实现高效的模糊绝缘子图像复原;同时,在网络目标函数中引入对比学习损失,充分地挖掘和利用清晰与模糊电力绝缘子图像的关联信息。构建运动模糊绝缘子图像数据集进行图像复原与缺陷检测实验,结果表明,该文的运动模糊绝缘子图像复原方法在峰值信噪比(peak signal-to-noise ratio,PSNR)和结构相似度(structure similarity index measure,SSIM)这两个指标上均高于Deblur GAN-v2、MIMO-UNet等主流算法,使用目标检测算法YOLOv5和YOLOv7对去模糊前后的绝缘子进行定位与自爆缺陷检测后显示该文方法在提升高压输电线路巡检任务中绝缘子定位与缺陷检测的准确率上具有实际应用意义。 展开更多
关键词 运动模糊图像复原 transformER 对比学习 绝缘子及缺陷检测
在线阅读 下载PDF
互补盲点策略和U型Transformer的地震数据去噪
10
作者 高磊 许轩 +1 位作者 罗芯汭 闵帆 《计算机应用研究》 北大核心 2025年第7期2056-2063,共8页
去除随机噪声可以显著提高地震数据的信噪比(SNR)。盲点驱动的无监督去噪方法无需标注数据,能自动提取特征,但其忽略了噪声相关性,导致去噪性能较差。为此,提出了互补盲点策略和U型Transformer的地震数据去噪框架(CBUTS)。首先,使用互... 去除随机噪声可以显著提高地震数据的信噪比(SNR)。盲点驱动的无监督去噪方法无需标注数据,能自动提取特征,但其忽略了噪声相关性,导致去噪性能较差。为此,提出了互补盲点策略和U型Transformer的地震数据去噪框架(CBUTS)。首先,使用互补盲点策略,通过迹线掩码和随机掩码互补采样,有效削弱噪声的空间联系;其次,引入可见盲点损失函数,融合非盲点和盲点去噪结果,降低信息损失;最后,设计了一种基于Transformer的U型盲点网络(STU-Net),通过增强全局和局部特征捕捉,进一步削弱噪声相关性,更准确地预测有效信号。实验结果表明,与经典以及先进的有监督和无监督方法进行比较,CBUTS在去除噪声和保留同相轴连续性方面效果更好。通过对结果的分析和比较,证明该方法完全适用于地震数据去噪。 展开更多
关键词 地震数据去噪 无监督 盲点策略 transformER
在线阅读 下载PDF
长期Transformer和自适应傅里叶变换的动态图卷积交通流预测研究
11
作者 张红 伊敏 +2 位作者 张玺君 李扬 张鹏程 《电子与信息学报》 北大核心 2025年第7期2249-2262,共14页
针对交通流长期趋势性与非平稳性不易有效建模,以及交通流的隐藏动态时空特征难以捕捉的问题,该文提出一种基于长期Transformer和自适应傅里叶变换的动态图卷积交通流预测模型(ADGformer)。其中,长期门控卷积层通过掩码子序列Transforme... 针对交通流长期趋势性与非平稳性不易有效建模,以及交通流的隐藏动态时空特征难以捕捉的问题,该文提出一种基于长期Transformer和自适应傅里叶变换的动态图卷积交通流预测模型(ADGformer)。其中,长期门控卷积层通过掩码子序列Transformer从长历史序列中学习压缩的、上下文信息丰富的子序列表示,并利用膨胀门控卷积从子序列的时间表示中有效捕捉交通流的长期趋势特征。并设计一种动态图构造器生成动态可学习图,并利用可学习动态图卷积对节点间潜在的和时变的空间依赖关系进行建模以有效捕获交通流的动态隐藏空间特征。其次,自适应频谱块利用傅里叶变换来增强特征表示并捕获长短期的交互作用,同时通过自适应阈值处理来降低交通流的非平稳性。实验结果表明,所提ADGformer模型具有较好的预测性能。 展开更多
关键词 交通流预测 动态图卷积 长期transformer 傅里叶变换 非平稳性
在线阅读 下载PDF
融合CNN与Transformer的遥感影像道路信息提取
12
作者 曲海成 王莹 +1 位作者 刘腊梅 郝明 《自然资源遥感》 北大核心 2025年第1期38-45,共8页
利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络... 利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络(convolutional neural networks,CNN)和Transformer中,然后,采用了双分支融合模块(shuffle attention dual branch fusion block,SA-DBF)来有效地结合这2个分支学习到的特征,从而实现全局信息与局部信息的融合。其中,双分支融合模块通过细粒度交互对这2个分支的特征进行建模,同时利用多重注意力机制充分提取特征图的通道和空间信息,并抑制掉无效的噪声信息。在公共数据集Massachusetts道路数据集上对模型进行测试,准确率(overall accuracy,OA)、交并比(intersection over union,IoU)和F 1等评价指标分别达到98.04%,88.03%和65.13%;与主流方法U-Net和TransRoadNet等进行比较,IoU分别提升了2.01个百分点和1.42个百分点,实验结果表明所提出的方法优于其他的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 级联神经网络 transformER 特征融合 注意力机制
在线阅读 下载PDF
基于CNN和Transformer双流融合的人体姿态估计
13
作者 李鑫 张丹 +2 位作者 郭新 汪松 陈恩庆 《计算机工程与应用》 北大核心 2025年第5期187-199,共13页
卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transfor... 卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transformer处理全局信息的优势,构建一种CNN-Transformer双流的并行网络架构来聚合丰富的特征信息。由于传统Transformer的输入需要将图片展平为多个patch,不利于提取对位置敏感的人体结构信息,因此将其多头注意力结构进行改进,使模型输入能够保持原始2D特征图的结构;同时提出特征耦合模块融合两个分支不同分辨率下的特征,最大限度地保留局部特征与全局特征;最后引入改进后的坐标注意力模块(coordinate attention),进一步提升网络的特征提取能力。在COCO和MPII数据集上的实验结果表明所提模型相对目前主流模型具有更高的检测精度,从而说明所提模型能够充分捕获并融合人体姿态中的局部和全局特征。 展开更多
关键词 卷积神经网络 transformER 局部特征 全局特征 2D特征图 特征耦合
在线阅读 下载PDF
CNN联合多尺度Transformer的高光谱与多光谱图像融合
14
作者 徐光宪 周伟杰 马飞 《红外技术》 北大核心 2025年第1期52-62,共11页
高光谱图像具有丰富的光谱信息,多光谱图像具有精妙的几何特征,融合高分辨率的多光谱图像和低分辨率的高光谱图像可以获取更为全面的遥感数据图像。然而现有的融合网络大多数基于卷积神经网络所设计,对于结构复杂的遥感类图像而言,依赖... 高光谱图像具有丰富的光谱信息,多光谱图像具有精妙的几何特征,融合高分辨率的多光谱图像和低分辨率的高光谱图像可以获取更为全面的遥感数据图像。然而现有的融合网络大多数基于卷积神经网络所设计,对于结构复杂的遥感类图像而言,依赖于核大小的卷积运算,容易导致特征融合阶段缺乏一些全局上下文信息。为保证图像融合的质量,本文提出了一种CNN(Convolutional Neural Network,CNN)联合多尺度transformer网络来实现多光谱和高光谱图像融合,结合了CNN的特征提取能力与transformer的全局建模优势。网络将融合任务分为了两个阶段,特征提取阶段和融合阶段。特征提取阶段,针对图像特性,基于卷积神经网络分别设计了不同模块用于特征提取。融合阶段,通过多尺度transformer模块从局部到全局建立信息间长距离关联,最后通过多层卷积层将特征映射为高分辨率的高光谱图像。经过在CAVE和Harvard数据集的实验结果表明,本文所提算法与其他经典算法相比,能更好地提升融合图像的质量。 展开更多
关键词 高光谱图像 多光谱图像 卷积神经网络 transformER 图像融合
在线阅读 下载PDF
不均衡样本下轴承故障的LSGAN‑Swin Transformer诊断方法
15
作者 刘杰 谭玉涛 +1 位作者 谷艳玲 杨娜 《振动工程学报》 北大核心 2025年第8期1775-1787,共13页
针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或... 针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或缺少的轴承数据集,引入窗口自注意力网络进行轴承故障状态识别,使用两种数据集验证所提方法的有效性,并分别与SGAN、WGAN进行对比,证明LSGAN生成的数据训练模型具有更高的准确率。在小样本条件下训练LSGAN,将所提Swin Transformer(Swin-T)模型与CNN、AlexNe和SqueezeNet进行对比,诊断准确率分别提升了34.85%、13.45%和12.95%。通过t-SNE可视化分析对模型分类效果进行评估,结果表明,LSGAN-Swin-T模型在训练样本数量较少时仍能较好地满足故障诊断中的需求,为不均衡数据下的轴承故障诊断研究提供思路。 展开更多
关键词 故障诊断 滚动轴承 不均衡样本 最小二乘生成对抗网络 Swin transformer
在线阅读 下载PDF
小数据集上基于语义的局部注意视觉Transformer方法
16
作者 冯欣 王俊杰 +1 位作者 钟声 方婷婷 《计算机应用研究》 北大核心 2025年第1期314-320,共7页
在小数据集上从零开始训练时,视觉Transformer无法与同规模的卷积神经网络媲美。基于图像的局部注意力方法,可以显著提高ViT的数据效率,但是会丢失距离较远但相关的补丁之间的信息。为了解决上述问题,提出一种双向并行局部注意力视觉Tra... 在小数据集上从零开始训练时,视觉Transformer无法与同规模的卷积神经网络媲美。基于图像的局部注意力方法,可以显著提高ViT的数据效率,但是会丢失距离较远但相关的补丁之间的信息。为了解决上述问题,提出一种双向并行局部注意力视觉Transformer的方法。该方法首先在特征层面上对补丁进行分组,在组内执行局部注意力,以利用特征空间中补丁之间的关系弥补信息丢失。其次,为了有效融合补丁之间的信息,将基于语义的局部注意力和基于图像的局部注意力并行结合起来,通过双向自适应学习来增强ViT模型在小数据上的性能。实验结果表明,该方法在计算量为15.2 GFLOPs和参数量为57.2 M的情况下,分别在CIFAR-10和CIFAR-100数据集上实现了97.93%和85.80%的准确性。相比于其他方法,双向并行局部注意力视觉Transformer在增强局部引导能力的同时,保持了局部注意力所需属性的有效性。 展开更多
关键词 深度学习 图像分类 transformER 局部注意力 基于语义的局部注意
在线阅读 下载PDF
基于改进Transformer的持续血糖浓度预测模型
17
作者 徐鹤 杨丹丹 +1 位作者 刘思行 季一木 《数据采集与处理》 北大核心 2025年第4期1065-1081,共17页
糖尿病是一种普遍存在的慢性疾病,做好血糖控制对糖尿病的预防具有重要作用。然而,持续血糖监测(Continuous glucose monitoring,CGM)过程中数据的不确定性显著增加了血糖预测的难度。因此,提出一种新的基于深度学习的血糖浓度预测模型... 糖尿病是一种普遍存在的慢性疾病,做好血糖控制对糖尿病的预防具有重要作用。然而,持续血糖监测(Continuous glucose monitoring,CGM)过程中数据的不确定性显著增加了血糖预测的难度。因此,提出一种新的基于深度学习的血糖浓度预测模型,旨在提高模型对传感器提取数据的适应性。在该模型中,堆叠式降噪自编码器(Stacked denoising auto encoder,SDAE)被嵌入Transformer编码器的结构中,实现对输入数据的重构去噪和特征提取;然后,采用混合位置编码策略替代原来的单一绝对位置编码嵌入,同时将轻量级解码器引入Transformer模型中,替代原始结构复杂的解码器,聚合来自不同层次的特征信息,同时获取局部和全局特征;最后,通过搭建的SDAE-改进Transformer网络对CGM数据序列并行化训练,更全面地捕捉数据中的时序模式和复杂关联,提高预测性能。实验结果表明,该模型相较于传统方法在血糖预测任务中取得了显著的性能提升,证实了其在处理CGM数据时的有效性和鲁棒性。 展开更多
关键词 持续血糖监测 神经网络 堆叠降噪自编码器 transformER 注意力机制
在线阅读 下载PDF
基于循环双向Transformer的伪CT图像生成方法
18
作者 肖宁 赵俊 +3 位作者 贾保平 强彦 赵涓涓 吕亚丽 《计算机辅助设计与图形学学报》 北大核心 2025年第6期994-1005,共12页
磁共振成像引导的放射治疗可以根据肿瘤和对器官的威胁情况实时调整治疗计划,依靠使用磁共振成像生成伪计算机断层扫描进行放射治疗.目前,伪层析成像的生成技术基于对抗性网络的生成方法,但它在训练过程中使用像素级损失更新网络参数,... 磁共振成像引导的放射治疗可以根据肿瘤和对器官的威胁情况实时调整治疗计划,依靠使用磁共振成像生成伪计算机断层扫描进行放射治疗.目前,伪层析成像的生成技术基于对抗性网络的生成方法,但它在训练过程中使用像素级损失更新网络参数,很容易导致模式崩溃,生成不稳定的伪计算机断层扫描.为了精准地实现基于磁共振图像的伪计算机断层扫描生成,利用视觉Transformer的上下文敏感性以及卷积算子的归纳偏置,提出一种循环双向Transformer医学图像合成方法.在编码预测阶段,循环双向Transformer利用U-Net编码得到的码本表示图像,并使用非自回归编码与向量量化方式缩短生成码本的长度,生成局部真实并且全局一致的图像;使用归一化互信息作为损失函数,并加入了循环一致性损失解决数据不匹配的问题.在颅脑磁共振成像数据集TCGA-GBM与CPTAC-GBM上进行一系列实验,验证了所提方法在图像生成任务上的有效性;该方法的MAE, PSNR和SSIM分别达到86.3, 25.96 dB和0.897;与对比方法相比,该方法也表现出优越的性能. 展开更多
关键词 双向transformer 伪计算机断层扫描 循环一致性 颅脑磁共振成像 U型网络
在线阅读 下载PDF
中文短文本情感分类:融入位置感知强化的Transformer-TextCNN模型研究
19
作者 李浩君 王耀东 汪旭辉 《计算机工程与应用》 北大核心 2025年第11期216-226,共11页
针对当前中文短文本情感分类模型文本位置信息与关键特征获取不足的问题,提出了一种融入位置感知强化的Transformer-TextCNN情感分类模型。利用BERT可学习绝对位置编码与正弦位置编码强化模型的位置感知能力,融合Transformer的全局上下... 针对当前中文短文本情感分类模型文本位置信息与关键特征获取不足的问题,提出了一种融入位置感知强化的Transformer-TextCNN情感分类模型。利用BERT可学习绝对位置编码与正弦位置编码强化模型的位置感知能力,融合Transformer的全局上下文理解能力与TextCNN的局部特征捕捉能力,分别提取中文短文本全局特征与局部特征,构建位置感知强化与特征协同的情感特征输出服务,实现中文短文本情感准确分类。实验结果表明,该模型在视频弹幕数据集上的准确率达到90.23%,在SMP2020数据集上的准确率达到87.38%。相较于最优的基线模型,准确率在视频弹幕数据集和SMP2020数据集上分别提高了1.98和0.44个百分点,在中文短文本情感分类任务中取得更好的分类效果。 展开更多
关键词 文本情感分类 BERT transformER textCNN 位置编码
在线阅读 下载PDF
基于Transformer和Text-CNN的日志异常检测
20
作者 尹春勇 张小虎 《计算机工程与科学》 北大核心 2025年第3期448-458,共11页
日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统... 日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统的基于Transformer的方法,难以捕捉日志序列的局部特征,针对上述问题,提出了基于Transformer和Text-CNN的日志异常检测方法LogTC。首先,通过规则匹配将日志转换成结构化的日志数据,并保留日志语句中的有效信息;其次,根据日志特性采用固定窗口或会话窗口将日志语句划分为日志序列;再次,使用自然语言处理技术Sentence-BERT生成日志语句的语义化表示;最后,将日志序列的语义化向量输入到LogTC日志异常检测模型中进行检测。实验结果表明,LogTC能够有效地检测日志数据中的异常,且在2个数据集上都取得了较好的结果。 展开更多
关键词 日志异常检测 深度学习 词嵌入 transformER Text-CNN
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部