期刊文献+
共找到4,821篇文章
< 1 2 242 >
每页显示 20 50 100
Millimeter-wave modeling based on transformer model for InP high electron mobility transistor
1
作者 ZHANG Ya-Xue ZHANG Ao GAO Jian-Jun 《红外与毫米波学报》 北大核心 2025年第4期534-539,共6页
In this paper,the small-signal modeling of the Indium Phosphide High Electron Mobility Transistor(InP HEMT)based on the Transformer neural network model is investigated.The AC S-parameters of the HEMT device are train... In this paper,the small-signal modeling of the Indium Phosphide High Electron Mobility Transistor(InP HEMT)based on the Transformer neural network model is investigated.The AC S-parameters of the HEMT device are trained and validated using the Transformer model.In the proposed model,the eight-layer transformer encoders are connected in series and the encoder layer of each Transformer consists of the multi-head attention layer and the feed-forward neural network layer.The experimental results show that the measured and modeled S-parameters of the HEMT device match well in the frequency range of 0.5-40 GHz,with the errors versus frequency less than 1%.Compared with other models,good accuracy can be achieved to verify the effectiveness of the proposed model. 展开更多
关键词 transformer model neural network high electron mobility transistor(HEMT) small signal model
在线阅读 下载PDF
基于Transformer的时间序列预测方法综述 被引量:4
2
作者 陈嘉俊 刘波 +2 位作者 林伟伟 郑剑文 谢家晨 《计算机科学》 北大核心 2025年第6期96-105,共10页
时间序列预测作为分析历史数据以预测未来趋势的关键技术,已广泛应用于金融、气象等领域。然而,传统方法如自回归移动平均模型和指数平滑法等在处理非线性模式、捕捉长期依赖性时存在局限。最近,基于Transformer的方法因其自注意力机制... 时间序列预测作为分析历史数据以预测未来趋势的关键技术,已广泛应用于金融、气象等领域。然而,传统方法如自回归移动平均模型和指数平滑法等在处理非线性模式、捕捉长期依赖性时存在局限。最近,基于Transformer的方法因其自注意力机制,在自然语言处理与计算机视觉领域取得突破,也开始拓展至时间序列预测领域并取得显著成果。因此,探究如何将Transformer高效运用于时间序列预测,成为推动该领域发展的关键。首先,介绍了时间序列的特性,阐述了时间序列预测的常见任务类别及评估指标。接着,深入解析Transformer的基本架构,并挑选了近年来在时间序列预测中广受关注的Transfo-rmer衍生模型,从模块及架构层面进行分类,并分别从问题解决、创新点及局限性3个维度进行比较和分析。最后,进一步探讨了时间序列预测Transformer在未来可能的研究方向。 展开更多
关键词 时间序列 transformer模型 深度学习 注意力机制 预测
在线阅读 下载PDF
基于转置Transformer模型的电化学储能自适应SOH估计方法 被引量:1
3
作者 李鹏 葛儒哲 +3 位作者 董存 孙树敏 张元欣 王士柏 《高电压技术》 北大核心 2025年第6期2945-2953,I0015,共10页
为了保障锂离子电池运行的可靠性和安全性,及时监测其健康状况,在Autoformer模型和iTransformer模型的基础上,结合线性回归模型,提出了一种基于转置Transformer的自适应特征感知电池健康状态融合估计模型。首先,从充电曲线中提取健康因... 为了保障锂离子电池运行的可靠性和安全性,及时监测其健康状况,在Autoformer模型和iTransformer模型的基础上,结合线性回归模型,提出了一种基于转置Transformer的自适应特征感知电池健康状态融合估计模型。首先,从充电曲线中提取健康因子。其次,将容量退化分解为退化趋势部分和容量再生部分,利用线性回归模型预测电池容量的退化趋势,利用转置Transformer模型估计电池容量再生部分,两部分组合以获得电池容量退化的估计结果。最后,利用注意力权重对模型赋予可解释性。研究结果表明:此方法在NASA锂电池老化数据集上的仿真实验中,预测误差明显小于其他时序预测模型,验证了所提方法的预测精确性与可靠性。论文为电池健康状态精确估计的进一步深入研究提供了参考。 展开更多
关键词 锂离子电池 健康状态 深度学习 注意力机制 转置transformer模型 可解释性
在线阅读 下载PDF
基于局部时序建模与Transformer的机器人运动技能学习
4
作者 朱晓庆 南博睿 +5 位作者 宫婉儒 毕兰越 郑忻宜 朱晓宇 吴通 张川 《北京理工大学学报》 北大核心 2025年第9期968-978,共11页
为了提高机器人运动技能学习的效率和精度,提出一种基于序列特征处理的动作决策Transformer模型,命名为门控机制Transformer(gated mechanism Transformer,GMT).模型以GPT-2为核心,结合门控机制提取隐藏状态特征,通过自回归建模捕捉时... 为了提高机器人运动技能学习的效率和精度,提出一种基于序列特征处理的动作决策Transformer模型,命名为门控机制Transformer(gated mechanism Transformer,GMT).模型以GPT-2为核心,结合门控机制提取隐藏状态特征,通过自回归建模捕捉时间依赖关系,解决机器人运动数据中深层特征难以提取的问题.同时,利用参数共享策略细化预测特征完成动作推理.GMT在MuJoCo平台的三个机器人运动技能任务中进行了验证.实验结果表明,GMT在学习效率和精度方面较Decision Transformer最高提升28.5%.研究表明,GMT能够高效建模机器人运动序列特征,为机器人动作决策提供新的技术方案. 展开更多
关键词 机器人运动 局部时序建模 transformER 门控机制 自回归建模
在线阅读 下载PDF
基于小波变换增强位置编码Transformer的空域流量预测
5
作者 唐卫贞 刘波 +1 位作者 黄洲升 田齐齐 《现代电子技术》 北大核心 2025年第8期127-132,共6页
随着全球化进程的加快和航空技术的发展,对空中交通流量预测的精度要求也越来越高。为提高空中交通流量预测精度,减轻空中交通管制员的压力,提出一种增强位置编码的Transformer模型。利用小波变换对原始空域流量数据进行分析,通过信噪... 随着全球化进程的加快和航空技术的发展,对空中交通流量预测的精度要求也越来越高。为提高空中交通流量预测精度,减轻空中交通管制员的压力,提出一种增强位置编码的Transformer模型。利用小波变换对原始空域流量数据进行分析,通过信噪比选出性能最优的小波基函数,再进一步计算出小波系数并将其融入位置编码,以增强模型对时间序列数据的理解能力。实验结果表明,所提模型能够准确捕捉空中交通流量数据中的非平稳性和突变特征,其RMSE和MAPE评估指标较原始Transformer模型分别降低了29.9与2.9%,较LSTM模型分别降低了34.5与3.4%。该模型不仅提升了空域流量预测的准确性,也证实了小波变换在增强模型时间序列数据理解中的有效性,且为交通流量管理提供了一种新的技术方案。 展开更多
关键词 空域流量预测 增强位置编码 transformer模型 小波变换 LSTM模型 小波基函数
在线阅读 下载PDF
双向自回归Transformer与快速傅里叶卷积增强的壁画修复 被引量:1
6
作者 陈永 张世龙 杜婉君 《湖南大学学报(自然科学版)》 北大核心 2025年第4期1-15,共15页
针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer... 针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer结构的全局语义特征修复模块,利用双向自回归机制与掩码语言模型(masked language modeling,MLM),提出改进的多头注意力全局语义壁画修复模块,提高对全局语义特征的修复能力.然后,构建了由门控卷积和残差模块组成的全局语义增强模块,增强全局语义特征一致性约束.最后,设计局部细节修复模块,采用大核注意力机制(large kernel attention,LKA)与快速傅里叶卷积提高细节特征的捕获能力,同时减少局部细节信息的丢失,提升修复壁画局部和整体特征的一致性.通过对敦煌壁画数字化修复实验,结果表明,所提算法修复性能更优,客观评价指标均优于比较算法. 展开更多
关键词 壁画修复 双向自回归transformer 掩码语言模型 快速傅里叶卷积 语义增强
在线阅读 下载PDF
Transformer在脑肿瘤MRI图像分割中的研究进展
7
作者 陈雷 李光宇 +2 位作者 杨锋 蔡婧欣 高梦谣 《磁共振成像》 北大核心 2025年第8期181-187,200,共8页
脑肿瘤精准分割至关重要,但传统卷积神经网络因局部感受野限制难以建模磁共振成像(magnetic resonance imaging,MRI)中的长距离依赖,影响对异质性高、边界模糊肿瘤的分割精度。Transformer凭借全局自注意力机制为此提供了新思路。本文... 脑肿瘤精准分割至关重要,但传统卷积神经网络因局部感受野限制难以建模磁共振成像(magnetic resonance imaging,MRI)中的长距离依赖,影响对异质性高、边界模糊肿瘤的分割精度。Transformer凭借全局自注意力机制为此提供了新思路。本文综述了Transformer在脑肿瘤MRI分割中的进展,重点分析了Transformer模型在层次化注意力、编解码结构、残差连接等关键技术上的改进,探讨了多模态融合、模态缺失应对、轻量化设计及注意力机制本身的创新策略;尽管Transformer显著提升了精度,仍面临数据稀缺、模态缺失鲁棒性、类别不平衡、计算成本高和可解释性不足等挑战,未来需聚焦数据高效利用、模态弹性建模、拓扑感知优化、轻量化与可解释性增强等方向。本文系统梳理了Transfomer在脑肿瘤MRI图像分割领域的研究现状,总结了目前研究的局限性并指出未来的研究方向,本文旨在为深入理解其技术演进、核心挑战与发展方向提供系统性参考。 展开更多
关键词 transformer模型 脑肿瘤分割 磁共振成像 多模态 注意力机制 轻量化设计
在线阅读 下载PDF
PAM结合TCN优化Transformer的光伏功率预测研究
8
作者 张红 李峰 +2 位作者 马彦宏 姬文宣 郑启鹏 《计算机工程》 北大核心 2025年第10期140-149,共10页
准确的光伏功率预测对于提高电网稳定性和用电效率至关重要。针对现有研究难以同时考虑光伏功率长期依赖性和短期变化模式的缺陷,提出一种金字塔注意力模块(PAM)结合时间卷积网络(TCN)优化Transformer的光伏功率预测方法Solarformer。... 准确的光伏功率预测对于提高电网稳定性和用电效率至关重要。针对现有研究难以同时考虑光伏功率长期依赖性和短期变化模式的缺陷,提出一种金字塔注意力模块(PAM)结合时间卷积网络(TCN)优化Transformer的光伏功率预测方法Solarformer。基于多种特征选择机制筛选输入特征,增强对光伏数据特征的表征能力;利用粗粒度构造模块和PAM优化Transformer编码器,在多尺度上捕获光伏功率的长期时间依赖特征;利用光伏功率日出日落效应约束机制和TCN优化Transformer解码器,增强光伏功率的短期变化特征,以更好地捕捉其短期变化模式。在澳大利亚Sanyo数据集上进行实验,结果表明,Solarformer能够有效提高光伏功率的预测精度,相比DLinear模型,其均方根误差(RMSE)、平均绝对误差(MAE)和对称平均绝对百分比误差(SMAPE)分别降低了约7.45%、6.99%和14.10%。 展开更多
关键词 光伏功率预测 transformer模型 金字塔注意力模块 约束机制 时间卷积网络
在线阅读 下载PDF
基于VMD和改进Transformer模型的镍镉蓄电池SOH预测研究
9
作者 于天剑 冯恩来 +1 位作者 伍珣 张庆东 《铁道科学与工程学报》 北大核心 2025年第7期3266-3279,共14页
动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode d... 动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode decomposition,VMD)和改进的Transformer模型,提出一种综合预测框架。首先,通过白鲸优化算法(beluga whale optimization,BWO)对VMD的超参数进行优化,利用VMD分解重构准确捕捉电池在其整个生命周期中的容量退化特性,消除蓄电池记忆效应对SOH预测研究带来的不良影响;其次,在Transformer编码模块中嵌入了长短时记忆网络自编码模块(long short-term memory network autoencoder,LSTM Autoencoder),以有效提取电池健康退化的短期特征信息并压缩数据维度,从而降低模型复杂度;最后,将Transformer解码层替换为全连接神经网络,以降低模型复杂度和减少预测误差累积现象,从而提高模型的预测性能和运行效率。并且在验证方案中,以实际动车组蓄电池为研究对象,通过消融实验以及横向对比实验双向证明研究算法具有最高的预测精度,输出预测结果在均方根误差、平均绝对误差相较于其他模型平均降低了60.83%和62.14%,在决定系数上平均提升了6.73%,具有高度的准确性和鲁棒性。可以实现对电池SOH实现精确的预测,对电池健康状态进行有效监控,为电池检修工作提供数据支撑和方法支持。 展开更多
关键词 镍镉蓄电池 SOH预测 变分模态分解 长短时记忆网络自编码器 改进transformer模型
在线阅读 下载PDF
基于特征选择与Transformer-LSTM的滚动轴承寿命预测 被引量:2
10
作者 李沁远 雷文平 +2 位作者 闫灏 娄永威 陈阳 《组合机床与自动化加工技术》 北大核心 2025年第2期200-206,211,共8页
滚动轴承作为旋转机械设备中的关键部件,影响着设备的可靠性运行。针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度和不同特征组合对预测模型精度的影响,提出一种基于特征选择与Transformer-LSTM的剩... 滚动轴承作为旋转机械设备中的关键部件,影响着设备的可靠性运行。针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度和不同特征组合对预测模型精度的影响,提出一种基于特征选择与Transformer-LSTM的剩余使用寿命预测模型。首先基于单调性、趋势性以及最大相关最小冗余特征选择算法对振动信号的时域、频域、时频域特征进行重要性排序和筛选,从而捕获特征与剩余寿命以及特征之间的相互的关系。然后将筛选后的特征输入Transformer-LSTM预测模型中,深度挖掘输入特征与RUL之间的复杂映射关系,从而更准确地进行预测。通过公开的轴承数据集进行实验验证,与其他RUL预测方法相比,所提方法的预测性能更优越。 展开更多
关键词 剩余使用寿命 特征选择 最大相关最小冗余 transformer-LSTM模型
在线阅读 下载PDF
前额叶皮层启发的Transformer模型应用及其进展 被引量:1
11
作者 潘雨辰 贾克斌 张铁林 《自动化学报》 北大核心 2025年第7期1403-1422,共20页
聚焦于生物结构与类脑智能的交叉研究方向,探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发.前额叶皮层在认知控制和决策制定中扮演着关键角色.首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物... 聚焦于生物结构与类脑智能的交叉研究方向,探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发.前额叶皮层在认知控制和决策制定中扮演着关键角色.首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展,然后探讨这些生物机制如何启发新型的类脑Transformer架构,重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性.最后,总结前额叶皮层启发的类脑新模型,在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力,为生物和人工智能两大领域之间交叉融合构建桥梁. 展开更多
关键词 生物结构 类脑智能 前额叶皮层 transformER 世界模型
在线阅读 下载PDF
基于Transformer和LSTM算法的河套灌区土壤水分预测研究 被引量:1
12
作者 王钥 郑方元 +3 位作者 雍婷 查元源 周龙才 徐祥森 《节水灌溉》 北大核心 2025年第2期1-8,14,共9页
土壤水是土壤中的关键指标,其变化直接影响着作物生长,并影响着水资源利用的管理决策。因此,准确地预测土壤水分有利于对农业水资源进行合理的规划利用。使用深度学习算法进行土壤水分预测在当前的农业、水资源管理和生态学等领域具有... 土壤水是土壤中的关键指标,其变化直接影响着作物生长,并影响着水资源利用的管理决策。因此,准确地预测土壤水分有利于对农业水资源进行合理的规划利用。使用深度学习算法进行土壤水分预测在当前的农业、水资源管理和生态学等领域具有重要性。深度学习算法能够从大规模数据中学习土壤水分的复杂模式和时空关系,为土壤水的准确预测提供了新的机会。为了探索新兴深度学习方法Transformer在土壤水分预测中的有效性,选择河套灌区义长灌域为研究区域,利用地下水位观测数据、气象数据、SMAP土壤水数据等作为训练数据,设置了1、5、10 d共3种数据滞后情况,验证Transformer算法在土壤水时间序列预测任务中的有效性,并与目前广泛应用于时序预测任务中的LSTM进行对比。研究表明Transformer在土壤水分时间序列预测任务中具有更好的预测能力,相比于LSTM,其R^(2)平均提升约0.181,RMSE平均下降27.6%。同时,Transformer在应对滞后变化带来的影响时更具鲁棒性,在3种数据滞后情况下Transformer的预测平均R^(2)分别比LSTM高出了0.121、0.167、0.256,站点平均RMSE分别降低了30.7%、28.6%、23.5%。此外,Transformer对于土壤水序列中的非线性信息的提取能力更强,对于高频振幅的土壤水时间序列Transformer拥有更强的预测能力。 展开更多
关键词 土壤水分预测 深度学习 时序预测 transformer模型 LSTM模型 数据滞后
在线阅读 下载PDF
CRAKUT:融合对比区域注意力机制与临床先验知识的U-Transformer用于放射学报告生成 被引量:1
13
作者 梁业东 朱雄峰 +3 位作者 黄美燕 张文聪 郭翰宇 冯前进 《南方医科大学学报》 北大核心 2025年第6期1343-1352,共10页
目的 提出一种对比区域注意力和先验知识融合的U型Transformer模型(CRAKUT),旨在解决文本分布不均衡、缺乏上下文临床知识以及跨模态信息转换等问题,提升生成报告的质量,辅助影像科医生诊断工作。方法 CRAKUT包括3个关键模块:对比注意... 目的 提出一种对比区域注意力和先验知识融合的U型Transformer模型(CRAKUT),旨在解决文本分布不均衡、缺乏上下文临床知识以及跨模态信息转换等问题,提升生成报告的质量,辅助影像科医生诊断工作。方法 CRAKUT包括3个关键模块:对比注意力图像编码器,利用数据集中常见的正常影像提取增强的视觉特征;外部知识注入模块,融合临床先验知识;U型Transformer,通过U型连接架构完成从视觉到语言的跨模态信息转换。在图像编码器中引入的对比区域注意力机制,通过强调正常与异常语义特征之间的差异,增强了异常区域的特征表示。此外,文本编码器中的临床先验知识注入模块结合了临床历史信息及由ChatGPT生成的知识图谱,从而提升了报告生成的上下文理解能力。U型Transformer在多模态编码器与报告解码器之间建立连接,融合多种类型的信息以生成最终的报告。结果 在2个公开的CXR数据集(IU-Xray和MIMIC-CXR)对CRAKUT模型进行评估,结果显示,CRAKUT在报告生成任务中实现了当前最先进的性能。在MIMIC-CXR数据集,CRAKUT取得了BLEU-4分数0.159、ROUGE-L分数0.353、CIDEr分数0.500;在IU-Xray数据集上,METEOR分数达到0.258,均优于以往模型的表现。结论 本文提出的方法在临床疾病诊断和报告生成中具有巨大的应用潜力。 展开更多
关键词 胸部X光 对比区域注意力 临床先验知识 跨模态交互 U-transformer模型
在线阅读 下载PDF
基于GC特征和脑区频段Transformer模型的EEG情感识别
14
作者 张睿 张雪英 +1 位作者 陈桂军 黄丽霞 《计算机工程》 北大核心 2025年第6期311-319,共9页
人的情感在发生变化时,不同通道间脑电图(EEG)信号会交互作用,且不同频段交互特征存在分脑区特性。为提取全脑交互性特征和充分捕获特征在不同脑区频段间依赖性,提出主对角线非0的格兰杰因果(GC)特征提取方法和分脑区分频段的Transforme... 人的情感在发生变化时,不同通道间脑电图(EEG)信号会交互作用,且不同频段交互特征存在分脑区特性。为提取全脑交互性特征和充分捕获特征在不同脑区频段间依赖性,提出主对角线非0的格兰杰因果(GC)特征提取方法和分脑区分频段的Transformer模型。首先,针对计算自身因果度量值时GC值为0的问题,通过改进GC算法,提取出EEG信号各通道非0的自身因果信息。然后,针对常用情感识别模型总是关注局部特性,缺乏全局视野的问题,根据不同频段下同脑区间存在关联的特点,对因果特征进行脑区频段划分,使用脑区频段Transformer模型将特征进行不同脑区不同频段特征间的依赖性和贡献捕获。在TYUT3.0数据集上的实验结果表明,在使用提出的脑区频段Transformer模型分类识别时,主对角线非0 GC矩阵相比于常用GC矩阵,平均识别准确率提升了约1.59百分点,说明了所提出特征的优越性;在使用提出的主对角线非0 GC矩阵作为特征时,提出的脑区频段Transformer模型平均准确率达到94.50%,较已有的模型平均识别准确率提升了1.89百分点,说明了脑区频段划分特征依赖性及全局融合思路的有效性。 展开更多
关键词 格兰杰因果 脑区 频段 transformer模型 脑电图情感识别
在线阅读 下载PDF
结合状态空间模型和Transformer的时空增强视频字幕生成 被引量:2
15
作者 孙昊英 李树一 +1 位作者 习泽宇 毋立芳 《信号处理》 北大核心 2025年第2期279-289,共11页
视频字幕生成(Video Captioning)旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等... 视频字幕生成(Video Captioning)旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等方式提高生成字幕的质量,但在时空联合建模方面仍存在不足,可能导致视觉信息提取不充分,影响字幕生成结果。为了解决这个问题,本文提出一种新颖的时空增强的状态空间模型和Transformer(SpatioTemporal-enhanced State space model and Transformer,ST2)模型,通过引入最近流行的具有全局感受野和线性的计算复杂度的Mamba(一种状态空间模型),增强时空联合建模能力。首先,通过将Mamba与Transformer并行结合,提出空间增强的状态空间模型(State Space Model,SSM)和Transformer(Spatial enHanced State space model and Transformer module,SH-ST),克服了卷积的感受野问题并降低计算复杂度,同时增强模型提取空间信息的能力。然后为了增强时间建模,我们利用Mamba的时间扫描特性,并结合Transformer的全局建模能力,提出时间增强的SSM和Transformer(Temporal enHanced State space model and Transformer module,TH-ST)。具体地,我们对SH-ST产生的特征进行重排序,从而使Mamba以交叉扫描的方式增强重排序后特征的时间关系,最后用Transformer进一步增强时间建模能力。实验结果表明,我们ST2模型中SH-ST和TH-ST结构设计的有效性,且在广泛使用的视频字幕生成数据集MSVD和MSR-VTT上取得了具有竞争力的结果。具体的,我们的方法分别在MSVD和MSR-VTT数据集上的绝对CIDEr分数超过最先进的结果6.9%和2.6%,在MSVD上的绝对CIDEr分数超过了基线结果4.9%。 展开更多
关键词 视频字幕生成 视频理解 状态空间模型 transformER
在线阅读 下载PDF
基于改进Transformer模型的Ad Hoc网络MAC协议识别技术
16
作者 何文雯 李盛祥 +3 位作者 王莉 李浩 李盈达 马鹏飞 《电讯技术》 北大核心 2025年第8期1240-1247,共8页
针对现有的媒体访问控制(Media Access Control,MAC)协议识别模型存在特征数据选取不完善和只关注局部特征的问题,首先,基于Transformer模型提出了Conv-Transformer模型。该模型将卷积操作引入到模型中,对卷积后特征图中的特征值进行分... 针对现有的媒体访问控制(Media Access Control,MAC)协议识别模型存在特征数据选取不完善和只关注局部特征的问题,首先,基于Transformer模型提出了Conv-Transformer模型。该模型将卷积操作引入到模型中,对卷积后特征图中的特征值进行分割拼接,并添加类别信息编码。其次,基于Exata平台搭建不同拓扑结构的Ad Hoc网络仿真场景,收集所有物理层的数据对Conv-Transformer模型进行训练和测试。测试结果表明,在Ad Hoc网络中对ALOHA、CSMA/CA、MACA和TDMA 4种MAC协议的识别任务上,提出的模型与经典深度学习模型递归神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convolutional Neural Network,CNN)和Transformer相比,比RNN模型的准确率提高了20.8%,比CNN模型的准确率提高了14.6%,比Transformer模型的准确率提高了68.8%。 展开更多
关键词 Ad Hoc网络 MAC协议识别 深度学习 transformer模型
在线阅读 下载PDF
基于Transformer模型的光学元件温度预测方法
17
作者 胡豪 杨晓峰 +2 位作者 王端 冯谦 胡争争 《强激光与粒子束》 北大核心 2025年第7期22-27,共6页
采用Transformer模型来解决多物理场耦合作用下的光学元件实时温度预测难题。试验结果表明,与经验模型法相比,Transformer模型法在均方根误差和平均绝对误差2个指标上分别提升70%和32%;与LSTM法相比,Transformer模型法在均方根误差和平... 采用Transformer模型来解决多物理场耦合作用下的光学元件实时温度预测难题。试验结果表明,与经验模型法相比,Transformer模型法在均方根误差和平均绝对误差2个指标上分别提升70%和32%;与LSTM法相比,Transformer模型法在均方根误差和平均绝对误差2个指标上分别提升66%和23%;Transformer模型法的决定系数值更加接近1,表明模型的预测结果与真实值吻合度更高。 展开更多
关键词 光学元件 transformer模型 实时温度 温度预测
在线阅读 下载PDF
基于Transformer转子应力预测模型的汽轮机启动优化
18
作者 胡晓丹 陈涛 +4 位作者 陈旭 石睿 吴凡 姜伟 谢诞梅 《汽轮机技术》 北大核心 2025年第3期210-214,共5页
汽轮机启动过程中的温度梯度和热应力变化直接影响其安全运行和使用寿命。以某型1000 MW等级核电汽轮机组为研究对象,分析启动过程中转子应力的变化情况,采用热-固耦合计算方法和基于Transformer的应力预测模型,利用遗传算法优化汽轮机... 汽轮机启动过程中的温度梯度和热应力变化直接影响其安全运行和使用寿命。以某型1000 MW等级核电汽轮机组为研究对象,分析启动过程中转子应力的变化情况,采用热-固耦合计算方法和基于Transformer的应力预测模型,利用遗传算法优化汽轮机启动方案。研究结果表明,通过对启动过程中的关键参数进行优化,启动时间缩短约16.37%,且转子最大应力较原始方案减少0.83MPa,应力预测模型的平均误差仅为1.69%。提出的启动优化方案在确保安全的前提下提高了经济效益,可为机组实际运行提供理论支持。 展开更多
关键词 汽轮机转子 热应力 应力预测 启动优化 机器学习 transformer模型
在线阅读 下载PDF
基于改进U-Transformer模型的金刚石刀刃异常检测算法
19
作者 王大伟 李丛 朱长水 《现代制造工程》 北大核心 2025年第7期120-128,共9页
针对金刚石刀刃缺陷特征差异大、缺陷样本少的问题,提出了一种基于改进U-Transformer特征重建模型的金刚石刀刃异常检测算法。该方法仅需使用正常样本训练即可完成异常区域的检测与定位。首先,利用冻结的预训练深度卷积神经网络(Convolu... 针对金刚石刀刃缺陷特征差异大、缺陷样本少的问题,提出了一种基于改进U-Transformer特征重建模型的金刚石刀刃异常检测算法。该方法仅需使用正常样本训练即可完成异常区域的检测与定位。首先,利用冻结的预训练深度卷积神经网络(Convolutional Neural Networks,CNN)模型提取多尺度融合特征,放大正常图像与异常图像的差异;然后,构建基于U型Transformer结构的编码器-解码器特征重建模型,计算重建特征与输入特征的特征相似性,生成相似性响应图;最后,为消除正常区域的噪声响应,利用多层感知机(Multi-Layer Perceptron,MLP)网络估计异常比例因子,修正相似性响应图,得到异常分数图。实验结果表明,提出的方法在金刚石刀刃缺陷数据集上Image AUROC指标为0.989,Piexl AUROC指标为0.992,能够满足金刚石刀刃异常检测需求。 展开更多
关键词 金刚石刀刃 异常检测 U-transformer模型 预训练 多层感知机网络 特征重建
在线阅读 下载PDF
基于Koopman时序延拓和CNN-Transformer模型的频率稳定指标预测
20
作者 杨雨昕 姚伟 +5 位作者 邓贤哲 兰宇田 黄伟 董诗焘 翟苏巍 文劲宇 《电网技术》 北大核心 2025年第8期3474-3485,I0126,I0127,共14页
新能源在能源发电结构中的比重大幅提升使得电力系统惯量水平降低,削弱了系统调频能力,导致频率稳定问题日益突出,因此在大扰动后对低惯量系统进行频率稳定指标预测十分关键。然而现有方法在预测精度与时效性之间存在矛盾,为此提出了一... 新能源在能源发电结构中的比重大幅提升使得电力系统惯量水平降低,削弱了系统调频能力,导致频率稳定问题日益突出,因此在大扰动后对低惯量系统进行频率稳定指标预测十分关键。然而现有方法在预测精度与时效性之间存在矛盾,为此提出了一种基于Koopman时序延拓和CNN-Transformer模型的频率稳定指标预测方法,以扰动后的暂态信息作为输入,对频率稳定指标进行快速准确地预测。所提方法基于Koopman算子理论对暂态特征序列在时间维度上进行延拓,以此作为CNN-Transformer模型的输入特征进行频率稳定指标的预测,该方法在满足高精度预测的同时提升了预测的时效性。最后以含风电的IEEE-39节点系统为例进行算例分析,测试结果表明频率偏移极值及其到达时间的平均绝对百分比误差(mean absolute percentage error,MAPE)分别为1.02%和0.11%,均小于当前先进算法,且预测时间仅为一般方法的30%,实验结果表明所提方法相比现有算法具有更高的准确性和时效性。同时通过对注意力权重分布进行可视化,验证了所提模型具有一定的可解释性。 展开更多
关键词 频率稳定 CNN-transformer模型 注意力可视化 Koopman算子理论 频率在线预测
在线阅读 下载PDF
上一页 1 2 242 下一页 到第
使用帮助 返回顶部