期刊文献+
共找到1,884篇文章
< 1 2 95 >
每页显示 20 50 100
基于视觉Transformer多模型融合的风电机组异常状态监测
1
作者 向玲 高鑫 +3 位作者 姚青陶 苏浩 胡爱军 程砺锋 《太阳能学报》 北大核心 2025年第4期522-529,共8页
为实现风电机组的异常状态监测并用于其故障诊断和日常维护,提出一种新的监测方法,该方法基于视觉Transformer(ViT)模型与长短期记忆(LSTM)网络融合,能有效识别风电机组的运行状态。首先,利用箱线图法和Spearman相关性分析对原始SCADA... 为实现风电机组的异常状态监测并用于其故障诊断和日常维护,提出一种新的监测方法,该方法基于视觉Transformer(ViT)模型与长短期记忆(LSTM)网络融合,能有效识别风电机组的运行状态。首先,利用箱线图法和Spearman相关性分析对原始SCADA数据进行预处理,去除无效数据并选择输入参数。然后,构建融合LSTM的ViT预测模型,并引入统计学中KL散度作为检测指标,对目标参数预测值与真实值进行计算分析。最后采用核密度估计确定安全阈值,根据检测指标是否越过安全阈值来识别风电机组异常状态。通过将该模型应用于华北某风场进行实例分析,并与其他深度学习模型对比。结果表明:该方法相较于其他模型能更好识别出风电机组异常状态。 展开更多
关键词 风电机组 状态监测 长短期记忆网络 视觉transformer KL散度
在线阅读 下载PDF
图像处理中CNN与视觉Transformer混合模型研究综述 被引量:6
2
作者 郭佳霖 智敏 +1 位作者 殷雁君 葛湘巍 《计算机科学与探索》 北大核心 2025年第1期30-44,共15页
卷积神经网络(CNN)与视觉Transformer是目前图像处理领域中两大重要的深度学习模型,两者经过多年来不断的研究与进步,已在该领域取得了非凡的成就。近些年来,CNN与视觉Transformer的混合模型正在逐步兴起,广泛的研究不断克服两种模型存... 卷积神经网络(CNN)与视觉Transformer是目前图像处理领域中两大重要的深度学习模型,两者经过多年来不断的研究与进步,已在该领域取得了非凡的成就。近些年来,CNN与视觉Transformer的混合模型正在逐步兴起,广泛的研究不断克服两种模型存在的弱项,高效地发挥出各自的亮点,在图像处理任务中表现出优异的效果。基于CNN与视觉Transformer混合模型进行深入阐述。总体概述了CNN与Vision Transformer模型的架构和优缺点,并总结混合模型的概念及优势。围绕串行结构融合方式、并行结构融合方式、层级交叉结构融合方式以及其他融合方式等四个方面全面回顾梳理了混合模型的研究现状和实际进展,并针对各种融合方式的主要代表模型进行总结与剖析,从多方面对典型混合模型进行评价对比。多角度叙述了混合模型在图像识别、图像分类、目标检测和图像分割等实际图像处理特定领域中应用研究,展现出混合模型在具体实践中的适用性和高效性。深入分析混合模型未来研究方向,并为后续该模型在图像处理中的研究与应用提出展望。 展开更多
关键词 卷积神经网络(CNN) 视觉transformer 混合模型 图像处理 深度学习
在线阅读 下载PDF
基于卷积视觉Transformer的木薯叶病识别模型
3
作者 谢聪 谢聪 +1 位作者 王天顺 姬少培 《现代电子技术》 北大核心 2025年第3期61-68,共8页
近年来,由于气候变化、室外空气污染物的增加以及全球变暖,木薯叶片病害变得更加普遍,及时和准确地检测木薯叶部病害对于防止其蔓延和确保农业生产的可持续性至关重要。然而,现有的木薯叶病检测模型很容易受到环境背景噪声的影响,这使... 近年来,由于气候变化、室外空气污染物的增加以及全球变暖,木薯叶片病害变得更加普遍,及时和准确地检测木薯叶部病害对于防止其蔓延和确保农业生产的可持续性至关重要。然而,现有的木薯叶病检测模型很容易受到环境背景噪声的影响,这使得其由于无法有效提取出木薯叶病图片的特征,而导致其识别检测精度较低。针对该问题,文中设计了一种卷积视觉Transformer的木薯叶病检测模型——CViT,并提出了一种最小注意力裁剪算法(LeIAP)来选择Transformer模型中每一层最重要的注意力头,以提高模型的性能。该模型在Transformer的基础上利用多头注意力模块来提取图像高级特征,利用软分割标记嵌入捕获局部信息,这不仅可以提高学习到的信息的丰富度,也有利于细粒度的特征学习。此外,该模型还使用了一种焦点角度间隔惩罚损失函数(F⁃Softmax),通过更好地学习类间距离,以改善模型在不同类别疾病数据上的识别精度。实验结果表明,该模型在2021年的Kaggle比赛数据集上的准确率均优于现有的主流模型。 展开更多
关键词 木薯叶病检测 视觉transformer 多头注意力 损失函数 识别精度 最小注意力裁剪
在线阅读 下载PDF
基于Transformer模型的时序数据预测方法综述 被引量:7
4
作者 孟祥福 石皓源 《计算机科学与探索》 北大核心 2025年第1期45-64,共20页
时序数据预测(TSF)是指通过分析历史数据的趋势性、季节性等潜在信息,预测未来时间点或时间段的数值和趋势。时序数据由传感器生成,在金融、医疗、能源、交通、气象等众多领域都发挥着重要作用。随着物联网传感器的发展,海量的时序数据... 时序数据预测(TSF)是指通过分析历史数据的趋势性、季节性等潜在信息,预测未来时间点或时间段的数值和趋势。时序数据由传感器生成,在金融、医疗、能源、交通、气象等众多领域都发挥着重要作用。随着物联网传感器的发展,海量的时序数据难以使用传统的机器学习解决,而Transformer在自然语言处理和计算机视觉等领域的诸多任务表现优秀,学者们利用Transformer模型有效捕获长期依赖关系,使得时序数据预测任务取得了飞速发展。综述了基于Transformer模型的时序数据预测方法,按时间梳理了时序数据预测的发展进程,系统介绍了时序数据预处理过程和方法,介绍了常用的时序预测评价指标和数据集。以算法框架为研究内容系统阐述了基于Transformer的各类模型在TSF任务中的应用方法和工作原理。通过实验对比了各个模型的性能、优点和局限性,并对实验结果展开了分析与讨论。结合Transformer模型在时序数据预测任务中现有工作存在的挑战提出了该方向未来发展趋势。 展开更多
关键词 深度学习 时序数据预测 数据预处理 transformer模型
在线阅读 下载PDF
基于转置Transformer模型的电化学储能自适应SOH估计方法
5
作者 李鹏 葛儒哲 +3 位作者 董存 孙树敏 张元欣 王士柏 《高电压技术》 北大核心 2025年第6期2945-2953,I0015,共10页
为了保障锂离子电池运行的可靠性和安全性,及时监测其健康状况,在Autoformer模型和iTransformer模型的基础上,结合线性回归模型,提出了一种基于转置Transformer的自适应特征感知电池健康状态融合估计模型。首先,从充电曲线中提取健康因... 为了保障锂离子电池运行的可靠性和安全性,及时监测其健康状况,在Autoformer模型和iTransformer模型的基础上,结合线性回归模型,提出了一种基于转置Transformer的自适应特征感知电池健康状态融合估计模型。首先,从充电曲线中提取健康因子。其次,将容量退化分解为退化趋势部分和容量再生部分,利用线性回归模型预测电池容量的退化趋势,利用转置Transformer模型估计电池容量再生部分,两部分组合以获得电池容量退化的估计结果。最后,利用注意力权重对模型赋予可解释性。研究结果表明:此方法在NASA锂电池老化数据集上的仿真实验中,预测误差明显小于其他时序预测模型,验证了所提方法的预测精确性与可靠性。论文为电池健康状态精确估计的进一步深入研究提供了参考。 展开更多
关键词 锂离子电池 健康状态 深度学习 注意力机制 转置transformer模型 可解释性
在线阅读 下载PDF
基于VMD和改进Transformer模型的镍镉蓄电池SOH预测研究
6
作者 于天剑 冯恩来 +1 位作者 伍珣 张庆东 《铁道科学与工程学报》 北大核心 2025年第7期3266-3279,共14页
动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode d... 动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode decomposition,VMD)和改进的Transformer模型,提出一种综合预测框架。首先,通过白鲸优化算法(beluga whale optimization,BWO)对VMD的超参数进行优化,利用VMD分解重构准确捕捉电池在其整个生命周期中的容量退化特性,消除蓄电池记忆效应对SOH预测研究带来的不良影响;其次,在Transformer编码模块中嵌入了长短时记忆网络自编码模块(long short-term memory network autoencoder,LSTM Autoencoder),以有效提取电池健康退化的短期特征信息并压缩数据维度,从而降低模型复杂度;最后,将Transformer解码层替换为全连接神经网络,以降低模型复杂度和减少预测误差累积现象,从而提高模型的预测性能和运行效率。并且在验证方案中,以实际动车组蓄电池为研究对象,通过消融实验以及横向对比实验双向证明研究算法具有最高的预测精度,输出预测结果在均方根误差、平均绝对误差相较于其他模型平均降低了60.83%和62.14%,在决定系数上平均提升了6.73%,具有高度的准确性和鲁棒性。可以实现对电池SOH实现精确的预测,对电池健康状态进行有效监控,为电池检修工作提供数据支撑和方法支持。 展开更多
关键词 镍镉蓄电池 SOH预测 变分模态分解 长短时记忆网络自编码器 改进transformer模型
在线阅读 下载PDF
基于Depth-wise卷积和视觉Transformer的图像分类模型 被引量:6
7
作者 张峰 黄仕鑫 +1 位作者 花强 董春茹 《计算机科学》 CSCD 北大核心 2024年第2期196-204,共9页
图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关... 图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关系进行建模,一些研究者将Transformer应用于图像分类任务,但为了满足Transformer的序列化和并行化要求,需要将图像分割成大小相等、互不重叠的图像块,破坏了相邻图像数据块之间的局部信息。此外,由于Transformer具有较少的先验知识,模型往往需要在大规模数据集上进行预训练,因此计算复杂度较高。为了同时建模图像相邻块之间的局部信息并充分利用图像的全局信息,提出了一种基于Depth-wise卷积的视觉Transformer(Efficient Pyramid Vision Transformer,EPVT)模型。EPVT模型可以实现以较低的计算成本提取相邻图像块之间的局部和全局信息。EPVT模型主要包含3个关键组件:局部感知模块(Local Perceptron Module,LPM)、空间信息融合模块(Spatial Information Fusion,SIF)和“+卷积前馈神经网络(Convolution Feed-forward Network,CFFN)。LPM模块用于捕获图像的局部相关性;SIF模块用于融合相邻图像块之间的局部信息,并利用不同图像块之间的远距离依赖关系,提升模型的特征表达能力,使模型学习到输出特征在不同维度下的语义信息;CFFN模块用于编码位置信息和重塑张量。在图像分类数据集ImageNet-1K上,所提模型优于现有的同等规模的视觉Transformer分类模型,取得了82.6%的分类准确度,证明了该模型在大规模数据集上具有竞争力。 展开更多
关键词 深度学习 图像分类 Depth-wise卷积 视觉transformer 注意力机制
在线阅读 下载PDF
基于视觉Transformer的运动特征选择融合微表情识别算法 被引量:1
8
作者 杜含月 张鹏 +3 位作者 林强 李晓桐 徐森 贲晛烨 《信号处理》 北大核心 2025年第2期267-278,共12页
微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,... 微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TVL1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。 展开更多
关键词 微表情识别 特征选择与融合 交叉注意力机制 视觉transformer
在线阅读 下载PDF
前额叶皮层启发的Transformer模型应用及其进展 被引量:1
9
作者 潘雨辰 贾克斌 张铁林 《自动化学报》 北大核心 2025年第7期1403-1422,共20页
聚焦于生物结构与类脑智能的交叉研究方向,探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发.前额叶皮层在认知控制和决策制定中扮演着关键角色.首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物... 聚焦于生物结构与类脑智能的交叉研究方向,探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发.前额叶皮层在认知控制和决策制定中扮演着关键角色.首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展,然后探讨这些生物机制如何启发新型的类脑Transformer架构,重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性.最后,总结前额叶皮层启发的类脑新模型,在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力,为生物和人工智能两大领域之间交叉融合构建桥梁. 展开更多
关键词 生物结构 类脑智能 前额叶皮层 transformer 世界模型
在线阅读 下载PDF
基于剪枝-蒸馏的视觉Transformer模型压缩
10
作者 郑洋 蒋晓天 +2 位作者 付东豪 郭开泰 梁继民 《西安电子科技大学学报》 2025年第4期55-65,共11页
现如今,视觉Transformer在计算机视觉领域的许多任务中都取得了卓越的表现,但其复杂的网络结构通常需要占用大量的存储和计算资源,因此难以在计算资源受限设备上广泛部署。为此提出了一种基于剪枝和蒸馏的视觉Transformer模型压缩方法,... 现如今,视觉Transformer在计算机视觉领域的许多任务中都取得了卓越的表现,但其复杂的网络结构通常需要占用大量的存储和计算资源,因此难以在计算资源受限设备上广泛部署。为此提出了一种基于剪枝和蒸馏的视觉Transformer模型压缩方法,旨在保证模型性能的前提下缩减模型大小。首先,通过对视觉Transformer的结构分析,确定宽度剪枝的对象为多头自注意力的注意力头和多层感知机中隐藏层的神经元,并采用基于模型损失函数变化的参数重要性评估策略对其进行参数重要性评估。其次,通过剪枝后蒸馏策略在模型宽度维度进行裁剪并恢复剪枝后宽度子网络的精度。最后,在深度维度上,通过剪枝后蒸馏得到最终的压缩模型。所提出方法在Tiny ImageNet、CIFAR-100和CIFAR-10数据集上对视觉Transformer进行了压缩实验。其中,在Tiny ImageNet上,ViT-S模型在参数量和计算量减少30%时,精度仅降低0.3%,而ViT-B模型精度甚至提升了0.6%。实验结果表明,所提方法能够有效实现模型精度和压缩率的平衡。 展开更多
关键词 模型压缩 视觉transformer 剪枝 知识蒸馏
在线阅读 下载PDF
基于时空Transformer的视觉目标跟踪算法 被引量:1
11
作者 武晓军 陈怡丹 +2 位作者 冯丽萍 宋长伟 何德清 《传感器与微系统》 北大核心 2025年第3期152-155,共4页
视觉目标跟踪中,由于目标移动速度不同,连续帧对时空邻域的贡献程度也不同。为学习视频帧对邻域信息的贡献,结合自注意力机制学习不同帧的权重大小,提出了一种基于时空Transformer的视觉目标跟踪方法。该算法主要通过关联多帧特征,并在... 视觉目标跟踪中,由于目标移动速度不同,连续帧对时空邻域的贡献程度也不同。为学习视频帧对邻域信息的贡献,结合自注意力机制学习不同帧的权重大小,提出了一种基于时空Transformer的视觉目标跟踪方法。该算法主要通过关联多帧特征,并在时域上进行信息聚合。首先,将图像通过空间Transformer编码器(STE)对空间特征进行编码。然后,通过时空Transformer解码器(STD)模块在时间维度上聚合帧间信息,以捕获时间和空间的全局上下文信息。最后,在LaSOT、GOT—10k等主流数据集进行测评。实验结果表明:算法在精度、成功率及其他评价指标上取得了一定程度的提升。 展开更多
关键词 视觉跟踪 transformer 时空特征 自注意力 特征编码
在线阅读 下载PDF
结合状态空间模型和Transformer的时空增强视频字幕生成 被引量:1
12
作者 孙昊英 李树一 +1 位作者 习泽宇 毋立芳 《信号处理》 北大核心 2025年第2期279-289,共11页
视频字幕生成(Video Captioning)旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等... 视频字幕生成(Video Captioning)旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等方式提高生成字幕的质量,但在时空联合建模方面仍存在不足,可能导致视觉信息提取不充分,影响字幕生成结果。为了解决这个问题,本文提出一种新颖的时空增强的状态空间模型和Transformer(SpatioTemporal-enhanced State space model and Transformer,ST2)模型,通过引入最近流行的具有全局感受野和线性的计算复杂度的Mamba(一种状态空间模型),增强时空联合建模能力。首先,通过将Mamba与Transformer并行结合,提出空间增强的状态空间模型(State Space Model,SSM)和Transformer(Spatial enHanced State space model and Transformer module,SH-ST),克服了卷积的感受野问题并降低计算复杂度,同时增强模型提取空间信息的能力。然后为了增强时间建模,我们利用Mamba的时间扫描特性,并结合Transformer的全局建模能力,提出时间增强的SSM和Transformer(Temporal enHanced State space model and Transformer module,TH-ST)。具体地,我们对SH-ST产生的特征进行重排序,从而使Mamba以交叉扫描的方式增强重排序后特征的时间关系,最后用Transformer进一步增强时间建模能力。实验结果表明,我们ST2模型中SH-ST和TH-ST结构设计的有效性,且在广泛使用的视频字幕生成数据集MSVD和MSR-VTT上取得了具有竞争力的结果。具体的,我们的方法分别在MSVD和MSR-VTT数据集上的绝对CIDEr分数超过最先进的结果6.9%和2.6%,在MSVD上的绝对CIDEr分数超过了基线结果4.9%。 展开更多
关键词 视频字幕生成 视频理解 状态空间模型 transformer
在线阅读 下载PDF
危化品车辆装卸载过程识别的Transformer-RNN模型 被引量:2
13
作者 李晓辉 孙子文 《传感技术学报》 北大核心 2025年第2期272-278,共7页
针对危化品运输过程的偷倒、漏倒问题导致的安全事故,构建Transformer-RNN模型,对运输过程中的运行、装载、卸载三种状态进行识别。首先获取通过安装了传感器的车辆传回的速度、载重、原始AD值等实时数据,通过差分提取速度差、载重差、... 针对危化品运输过程的偷倒、漏倒问题导致的安全事故,构建Transformer-RNN模型,对运输过程中的运行、装载、卸载三种状态进行识别。首先获取通过安装了传感器的车辆传回的速度、载重、原始AD值等实时数据,通过差分提取速度差、载重差、方向差等特征;其次构建融合Transformer和RNN的分类模型,通过Transformer完成对输入的表征学习,RNN进行学习,自注意力机制突出关键特征;最后由全连接网络输出分类结果。实验结果表明,所构建的模型在危化品车运输过程识别中的准确率、查准率、查全率和F1值均优于现有模型。 展开更多
关键词 车辆装卸载识别 transformer模型 循环神经网络 自注意力机制 时间序列
在线阅读 下载PDF
视觉Transformer(ViT)发展综述 被引量:4
14
作者 李玉洁 马子航 +2 位作者 王艺甫 王星河 谭本英 《计算机科学》 北大核心 2025年第1期194-209,共16页
视觉Transformer(Vision Transformer,ViT)是基于编码器-解码器结构的Transformer改进模型,已经被成功应用于计算机视觉领域。近几年基于ViT的研究层出不穷且效果显著,基于该模型的工作已经成为计算机视觉任务的重要研究方向,因此针对... 视觉Transformer(Vision Transformer,ViT)是基于编码器-解码器结构的Transformer改进模型,已经被成功应用于计算机视觉领域。近几年基于ViT的研究层出不穷且效果显著,基于该模型的工作已经成为计算机视觉任务的重要研究方向,因此针对近年来ViT的发展进行概述。首先,简要回顾了ViT的基本原理及迁移过程,并分析了ViT模型的结构特点和优势;然后,根据各ViT变体模型的改进特点,归纳和梳理了基于ViT的主要骨干网络变体改进方向及其代表性改进模型,包括局部性改进、结构改进、自监督、轻量化及效率改进等改进方向,并对其进行分析比较;最后,讨论了当前ViT及其改进模型仍存在的不足,对ViT未来的研究方向进行了展望。可以作为研究人员进行基于ViT骨干网络的研究时选择深度学习相关方法的一个权衡和参考。 展开更多
关键词 计算机视觉 模式识别 Vision transformer(ViT) 深度学习 自注意力
在线阅读 下载PDF
基于GC特征和脑区频段Transformer模型的EEG情感识别
15
作者 张睿 张雪英 +1 位作者 陈桂军 黄丽霞 《计算机工程》 北大核心 2025年第6期311-319,共9页
人的情感在发生变化时,不同通道间脑电图(EEG)信号会交互作用,且不同频段交互特征存在分脑区特性。为提取全脑交互性特征和充分捕获特征在不同脑区频段间依赖性,提出主对角线非0的格兰杰因果(GC)特征提取方法和分脑区分频段的Transforme... 人的情感在发生变化时,不同通道间脑电图(EEG)信号会交互作用,且不同频段交互特征存在分脑区特性。为提取全脑交互性特征和充分捕获特征在不同脑区频段间依赖性,提出主对角线非0的格兰杰因果(GC)特征提取方法和分脑区分频段的Transformer模型。首先,针对计算自身因果度量值时GC值为0的问题,通过改进GC算法,提取出EEG信号各通道非0的自身因果信息。然后,针对常用情感识别模型总是关注局部特性,缺乏全局视野的问题,根据不同频段下同脑区间存在关联的特点,对因果特征进行脑区频段划分,使用脑区频段Transformer模型将特征进行不同脑区不同频段特征间的依赖性和贡献捕获。在TYUT3.0数据集上的实验结果表明,在使用提出的脑区频段Transformer模型分类识别时,主对角线非0 GC矩阵相比于常用GC矩阵,平均识别准确率提升了约1.59百分点,说明了所提出特征的优越性;在使用提出的主对角线非0 GC矩阵作为特征时,提出的脑区频段Transformer模型平均准确率达到94.50%,较已有的模型平均识别准确率提升了1.89百分点,说明了脑区频段划分特征依赖性及全局融合思路的有效性。 展开更多
关键词 格兰杰因果 脑区 频段 transformer模型 脑电图情感识别
在线阅读 下载PDF
基于改进Transformer模型的Ad Hoc网络MAC协议识别技术
16
作者 何文雯 李盛祥 +3 位作者 王莉 李浩 李盈达 马鹏飞 《电讯技术》 北大核心 2025年第8期1240-1247,共8页
针对现有的媒体访问控制(Media Access Control,MAC)协议识别模型存在特征数据选取不完善和只关注局部特征的问题,首先,基于Transformer模型提出了Conv-Transformer模型。该模型将卷积操作引入到模型中,对卷积后特征图中的特征值进行分... 针对现有的媒体访问控制(Media Access Control,MAC)协议识别模型存在特征数据选取不完善和只关注局部特征的问题,首先,基于Transformer模型提出了Conv-Transformer模型。该模型将卷积操作引入到模型中,对卷积后特征图中的特征值进行分割拼接,并添加类别信息编码。其次,基于Exata平台搭建不同拓扑结构的Ad Hoc网络仿真场景,收集所有物理层的数据对Conv-Transformer模型进行训练和测试。测试结果表明,在Ad Hoc网络中对ALOHA、CSMA/CA、MACA和TDMA 4种MAC协议的识别任务上,提出的模型与经典深度学习模型递归神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convolutional Neural Network,CNN)和Transformer相比,比RNN模型的准确率提高了20.8%,比CNN模型的准确率提高了14.6%,比Transformer模型的准确率提高了68.8%。 展开更多
关键词 Ad Hoc网络 MAC协议识别 深度学习 transformer模型
在线阅读 下载PDF
一种基于Transformer架构的多层级自动睡眠分期模型 被引量:1
17
作者 金峥 贾克斌 《电子学报》 北大核心 2025年第2期545-557,共13页
睡眠是人体保持健康的重要生理过程,基于多导睡眠图(PolySomnoGraphy,PSG)的睡眠分期是诊疗睡眠疾病和评估睡眠质量的重要依据.人工睡眠分期法在处理大规模PSG数据时存在耗时久、效率低的问题,采用深度学习模型有效表征PSG的自动睡眠分... 睡眠是人体保持健康的重要生理过程,基于多导睡眠图(PolySomnoGraphy,PSG)的睡眠分期是诊疗睡眠疾病和评估睡眠质量的重要依据.人工睡眠分期法在处理大规模PSG数据时存在耗时久、效率低的问题,采用深度学习模型有效表征PSG的自动睡眠分期法显现出广阔的研究前景.针对现有模型未充分考虑PSG片段内波形信息、通道间相关性信息、片段间睡眠转换信息的问题,本文提出一种基于Transformer架构的多层级睡眠分期网络模型(Hierarchical transFormer sleep staging model,HierFormer),采用Transformer编码器有效提取片段内波形特征、通道相关性特征、片段间转换特征,并结合注意力机制综合提升模型对于PSG片段内、通道间、片段间三种视角信号特性的可解释性.基于睡眠集-欧洲数据格式(sleep-European Data Format,sleep-EDF)扩展睡眠数据集开展的实验结果表明:本文模型利用更少的参数量取得优于多种现有基线模型的分期性能,分类准确率、宏平均精确率、宏平均召回率、宏平均F1分数、科恩卡帕系数分别可达到0.807、0.784、0.735、0.750和0.721.通过在三种视角下不同特征编码方式的性能对比和注意力分数的可视化,本文进一步证明了所提模型良好的编码能力和可解释性.本研究旨在为睡眠分期领域的深度学习应用提供新途径和新技术,从而辅助医生提升睡眠疾病诊疗效率. 展开更多
关键词 多导睡眠图(PSG) 自动睡眠分期 深度神经网络 transformer架构 注意力机制 模型可解释性
在线阅读 下载PDF
基于Transformer模型的光学元件温度预测方法
18
作者 胡豪 杨晓峰 +2 位作者 王端 冯谦 胡争争 《强激光与粒子束》 北大核心 2025年第7期22-27,共6页
采用Transformer模型来解决多物理场耦合作用下的光学元件实时温度预测难题。试验结果表明,与经验模型法相比,Transformer模型法在均方根误差和平均绝对误差2个指标上分别提升70%和32%;与LSTM法相比,Transformer模型法在均方根误差和平... 采用Transformer模型来解决多物理场耦合作用下的光学元件实时温度预测难题。试验结果表明,与经验模型法相比,Transformer模型法在均方根误差和平均绝对误差2个指标上分别提升70%和32%;与LSTM法相比,Transformer模型法在均方根误差和平均绝对误差2个指标上分别提升66%和23%;Transformer模型法的决定系数值更加接近1,表明模型的预测结果与真实值吻合度更高。 展开更多
关键词 光学元件 transformer模型 实时温度 温度预测
在线阅读 下载PDF
基于双路视觉Transformer的图像风格迁移
19
作者 纪宗杏 贝佳 +1 位作者 刘润泽 任桐炜 《北京航空航天大学学报》 北大核心 2025年第7期2488-2497,共10页
图像风格迁移旨在根据风格图像调整内容图像的视觉属性,使其保留原始内容的同时呈现出特定风格样式,从而生成具有视觉吸引力的风格化图像。针对现有代表性方法大多未考虑不同图像域间的编码差异,专注提取图像局部特征而忽视了全局上下... 图像风格迁移旨在根据风格图像调整内容图像的视觉属性,使其保留原始内容的同时呈现出特定风格样式,从而生成具有视觉吸引力的风格化图像。针对现有代表性方法大多未考虑不同图像域间的编码差异,专注提取图像局部特征而忽视了全局上下文信息的重要性,提出一种新型的基于双路视觉Transformer的图像风格迁移方法Bi-Trans,对内容图像域和风格图像域进行独立编码,提取风格参数向量以离散化表征图像风格,通过交叉注意力机制与条件实例归一化(CIN)将内容图像标定至目标域风格,从而生成风格化图像。实验结果表明,该方法无论是内容保留度还是风格还原度均优于现有方法。 展开更多
关键词 图像风格迁移 视觉transformer 任意风格化 条件实例归一化 注意力机制
在线阅读 下载PDF
基于CEEMDAN-FESC-OVMD-Transformer耦合模型的长江上游月径流预测
20
作者 徐嘉远 邹磊 +2 位作者 张利平 王飞宇 夏军 《水资源保护》 北大核心 2025年第4期197-209,共13页
为提升水文要素非一致性变异背景下的长江上游月径流预测精度,基于宜昌与寸滩水文站1961—2022年逐月径流数据,构建了基于自适应噪声完备集合经验模态分解(CEEMDAN)、模糊熵(FE)、谱聚类(SC)、最优变分模态分解(OVMD)与Transformer深度... 为提升水文要素非一致性变异背景下的长江上游月径流预测精度,基于宜昌与寸滩水文站1961—2022年逐月径流数据,构建了基于自适应噪声完备集合经验模态分解(CEEMDAN)、模糊熵(FE)、谱聚类(SC)、最优变分模态分解(OVMD)与Transformer深度学习模型耦合的CEEMDAN-FESC-OVMD-Transformer混合预测模型对长江上游月径流进行模拟预测。结果表明:CEEMDAN-FESC-OVMD-Transformer混合预测模型在宜昌与寸滩水文站具有较好的月径流预测效果,训练期纳什效率系数高于0.9,测试期纳什效率系数分别达到0.84与0.89;CEEMDAN-FESC-OVMD分解框架可提升汛期峰值流量预测精度;OVMD二次分解结构可有效降低月径流高频序列复杂度,提升径流的预测稳定性。 展开更多
关键词 月径流预测 CEEMDAN VMD transformer 耦合模型 长江上游
在线阅读 下载PDF
上一页 1 2 95 下一页 到第
使用帮助 返回顶部