期刊文献+
共找到2,330篇文章
< 1 2 117 >
每页显示 20 50 100
基于BSimilar优化PTransformer的光伏功率短期预测
1
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 transformer 相似日
在线阅读 下载PDF
一种基于时域融合Transformer的4D航迹预测方法
2
作者 孔建国 马珂昕 +2 位作者 梁海军 张向伟 常瀚文 《电讯技术》 北大核心 2026年第1期21-29,共9页
针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以... 针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以体现飞行过程中不同阶段的差异;采用TFT模型有效捕捉各特征之间的隐式相关性,从而提高了预测精度;同时,结合分位数回归实现不确定性量化,提供了具有置信区间的航迹预测结果。实验表明,所提方法在真实数据上优于传统模型:与CNNLSTM模型和LSTM模型相比,平均距离误差分别减少了22.7%和50.9%,纵向、横向和垂直误差分别为305.01 m、177.91 m和25.23 m,验证了模型在解决航迹预测问题上的有效性,能够为管制精细化调控提供有效支持。 展开更多
关键词 空中交通管制 4D航迹预测 自动相关监视系统数据 时域融合transformer 时间序列预测
在线阅读 下载PDF
基于近红外光谱与Transformer的烟叶感官指标预测方法
3
作者 张云伟 张健涛 +3 位作者 张海 周渭皓 李斌 陶成金 《农业机械学报》 北大核心 2026年第1期386-396,共11页
为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用... 为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用Savitzky-Golay卷积平滑法(SG)、一阶导数法(D1)、多元散射校正(MSC)3种光谱预处理技术有效消除基线漂移和散射干扰;进而设计了一种面向光谱数据特征的Transformer预测模型,实现了烟叶感官质量三维评价体系(风格特征:清香、甜香、焦香;烟气特征:浓度、劲头;质量特征:香气质、香气量、杂气、刺激、余味)的精准预测,并采用了SHAP方法对模型进行分析,增强了模型的可解释性。结果表明,模型对各感官指标测试集预测的平均绝对误差均不高于0.56,具有较好可用性;针对不同感官指标,模型表现出对不同光谱特征波段的捕捉,有效挖掘了光谱特征的协同作用机制,具有较好可解释性。在此基础上,进一步结合多维相似度分析设计了一种辅助烟叶替代方法,可为烟叶替代与配方优化提供量化决策支持。 展开更多
关键词 烟叶感官指标 近红外光谱 transformer 预测模型 烟叶替代
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
4
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R^(2))高达99.91%. 展开更多
关键词 风速预测 群分解 transformer Kolmogorov-Arnold网络
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
5
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 transformer模型 精准识别 室内模型试验
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
6
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
SPTJNet:用于图像去除雨条纹的稀疏Transformer和联合注意力轻量化网络
7
作者 尹震宇 石卓 《小型微型计算机系统》 北大核心 2026年第1期121-132,共12页
下雨天气会严重影响图像的清晰度,导致图像视觉质量下降.图像去雨技术能有效去除雨条纹的干扰,提升图像的清晰度和细节表现.然而,现有方法大多依赖卷积或单一注意力机制,限制了其在捕捉全局感受野和处理复杂雨条纹方面的能力,导致图像... 下雨天气会严重影响图像的清晰度,导致图像视觉质量下降.图像去雨技术能有效去除雨条纹的干扰,提升图像的清晰度和细节表现.然而,现有方法大多依赖卷积或单一注意力机制,限制了其在捕捉全局感受野和处理复杂雨条纹方面的能力,导致图像模糊和细节丢失.此外,单一注意力机制增加了模型的复杂度和计算成本,限制了实际应用效率.为此,本文提出了一种基于稀疏Transformer和联合注意力的轻量化图像去雨网络(SParse Transformer and Joint attention Network,SPTJNet).该网络设计了稀疏Transformer模块(SParse Transformer module,SPT),在提升性能的同时减少计算冗余,提高推理效率.并设计了联合注意力模块(Joint Attention Module,JAM),由通道注意力的压缩激励单元(Squeeze-and-Excitation,SE)和高效局部注意力单元(Efficient Local Attention Unit,ELAU)组成,能增强对复杂场景的处理能力.实验表明,SPTJNet在去雨任务中表现出色. 展开更多
关键词 图像去雨 稀疏transformer 联合注意力 通道注意力 高效局部注意力
在线阅读 下载PDF
基于改进实时检测Transformer的轻量级番茄果实检测算法
8
作者 卢承方 崔艳荣 +2 位作者 胡蓉华 王浩宇 陈鹏翔 《山东农业科学》 北大核心 2026年第1期150-163,共14页
针对复杂环境下番茄果实目标多、外形各异、分布密集等导致智能采摘识别难度大的问题,同时为解决Transformer架构巨大运算量导致的模型边缘设备部署困难的问题,本研究提出一种改进实时检测Transformer(Real-Time Detection Transformer,... 针对复杂环境下番茄果实目标多、外形各异、分布密集等导致智能采摘识别难度大的问题,同时为解决Transformer架构巨大运算量导致的模型边缘设备部署困难的问题,本研究提出一种改进实时检测Transformer(Real-Time Detection Transformer,RT-DETR)的番茄果实检测模型SPC-DETR。首先,实地拍摄采集多尺度的复杂环境下番茄果实图片,并从公开数据集中筛选符合复杂环境的番茄果实图片作为补充,进行标注及数据增强后构建了一个包含3398张图片的番茄果实数据集。其次,以RT-DETR-R18为基线模型,进行如下改进:选用计算复杂度低且检测精度较高的StarNet作为主干特征提取基准网络,并引入倒置残差移动块iRMB,构建iR-StarNet作为主干网络,在轻量化主干的同时进一步提高模型对番茄果实的特征提取能力;设计一种改进的并行空洞卷积结构块EMA-PDC,该模块通过融合跨空间学习的高效多尺度注意力机制,可在减少计算量的同时扩大模型感受野,提升模型多尺度表示的准确性;使用DEA-Net提出的内容引导注意力融合方案CGA-Fusion改进颈部网络,进一步提高模型表征能力。实验结果表明,SPC-DETR的精确率、召回率和平均精度均值(mAP50)分别为88.0%、83.7%和90.2%,分别比基线模型RT-DETR-R18提高2.0、0.3、1.7个百分点,模型权重大小、参数量、浮点运算量分别为25.2 MB、12.9 M、34.3 GFLOPs,分别比RT-DETR-R18降低34.72%、36.14%、41.47%,综合表现优于目前大部分主流的YOLO系列模型和DETR系列模型。本研究结果可为提升智能采摘机器人识别检测复杂环境下番茄果实的准确率提供技术参考。 展开更多
关键词 番茄果实识别 transformer RT-DETR 轻量化 目标实时检测 深度学习
在线阅读 下载PDF
基于显著位置交互Transformer的小样本图像分类方法
9
作者 宋朝琦 刘颖 +1 位作者 何敬鲁 李大湘 《计算机工程》 北大核心 2026年第2期167-176,共10页
图像分类作为计算机视觉的基础任务,目前在大规模数据集上的研究已取得显著成效。然而,在低样本量数据条件下,传统的深度学习方法受制于过拟合问题,影响模型的泛化能力。为此,设计一种新颖的小样本图像分类方法,用于提升模型在样本数据... 图像分类作为计算机视觉的基础任务,目前在大规模数据集上的研究已取得显著成效。然而,在低样本量数据条件下,传统的深度学习方法受制于过拟合问题,影响模型的泛化能力。为此,设计一种新颖的小样本图像分类方法,用于提升模型在样本数据稀缺时的分类性能。该方法基于显著位置相互作用Transformer与目标分类器,借鉴ViT(Vision Transformer)模型的结构和优势,引入具有显著位置选择的相互作用多头自注意力(HI-MHSA)模块,同时增加对多头自注意力模块中各个注意力头之间的交互,强化模型对输入图像中显著区域的关注,节省计算资源,并通过目标分类器的监督指导,进一步提升模型的学习效率和准确性。实验结果表明,在miniImageNet、tieredImageNet以及CUB数据集上,该方法在5-way 1-shot任务中分类准确率分别约为67.09%、72.07%和79.82%,在5-way 5-shot任务中分类准确率分别约为83.54%、85.62%和90.35%。实验结果显示,该方法在小样本图像分类任务中具有优秀的性能和高度的实用性。 展开更多
关键词 小样本图像分类 transformer 注意力机制 小样本分类器 显著位置选择
在线阅读 下载PDF
基于Transformer-XGBoost框架的轨交车辆电池多视角数据健康诊断研究
10
作者 王健 毛建 +4 位作者 唐超伟 孙小康 候晓双 王春生 廖垠钦 《电源技术》 北大核心 2026年第1期129-142,共14页
锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规... 锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规数据驱动模型,难以全面捕捉电池退化过程中电化学特性与时序动态的多尺度变化,导致预测精度和鲁棒性均受限。提出了一种基于多视角数据分析的SOH预测方法,通过融合电压视图与时间视图下的增量容量(IC)曲线信息构建多视图健康因子(HI),并设计了结合Transformer与极限梯度提升(XGBoost)的预测框架。其中,Transformer采用动态时间窗调整和双尺度注意力机制,以适应不同退化阶段下的时序特征提取。而XGBoost则通过引入物理信息约束,进一步提升了预测的稳定性与鲁棒性。在马里兰大学的PL13电池训练集中,该方法实现的均方根误差(RMSE)仅为3.13×10^(−3),决定系数R^(2)高达0.997;而在PL11电池测试集中,RMSE仅为4.57×10^(−3),R^(2)达到0.994,充分验证了该方法在多视角特征融合和动态时序建模方面的卓越性能。 展开更多
关键词 健康状态 多视角数据分析 transformer XGBoost 电池管理系统
在线阅读 下载PDF
基于Transformer的壁画裂缝自动化数字修复方法
11
作者 刘晨玲 李炳焱 +3 位作者 米艳华 薛峰 王建华 戴震 《太原理工大学学报》 北大核心 2026年第1期186-194,共9页
【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多... 【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多依赖专家知识或人工辅助,无法实现壁画数字修复的自动化。【方法】本文结合北方地区长期缺水干燥的环境特征,针对壁画文物可能存在的撕扯断裂或裂缝错位问题,实现自动化数字修复。具体而言,本研究提出基于Transformer的壁画裂缝自动化数字修复方法;基于VGG16-Unet模型,创新性提出基于膨胀核的裂缝掩码优化方法,通过形态学膨胀操作显著提升裂缝覆盖率。此外,利用Transformer的全局结构学习能力与CNN上采样实现结构修复,并引入傅立叶卷积与大核注意力模块完成纹理细节还原和高保真修复。【结果】实验基于山西多地真实壁画数据验证了该方法的有效性,结果表明,该方法在裂缝识别覆盖度、结构还原度及纹理协调性方面均优于传统方法,尤其对北方干燥地区特有的断裂错位型裂缝修复效果显著。 展开更多
关键词 壁画修复 深度学习 壁画图像分割 transformer
在线阅读 下载PDF
融合Transformer和Inception的网络入侵检测研究
12
作者 张万琪 王家兴 宋振峰 《电信科学》 北大核心 2026年第1期127-144,共18页
针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transf... 针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transformer-DSC-Inception-pyramid squeeze attention,T-DIPSA)的入侵检测方法,即T-DIPSA-FRAM。该方法融合自适应过采样(adaptive synthetic sampling,ADASYN)、精简编辑最近邻(reduced edited nearest neighbors,RENN)和局部离群因子(local outlier factor,LOF)算法,提高模型在复杂网络流量环境下的检测性能。首先,采用自适应混合采样与离群点检测(AR-LOF)算法平衡数据集;其次,设计包含残差注意力模块的特征预提取模块,初步高效提取网络流量中的关键特征,改善高维特征的学习稳定性;最后,设计局部特征增强注意力模块,利用Transformer编码器结构捕捉长距离依赖关系的同时,融合DIPSA的前馈网络聚焦多尺度局部空间特征,增强模型对动态、非均匀分布流量的敏感性。实验结果表明,在UNSW-NB15数据集和ToN-IoT数据集的二分类和多分类检测任务中,T-DIPSA-FRAM取得的F1值分别为93.58%、95.35%,加权F1值分别为88.26%、91.03%。研究表明,T-DIPSA-FRAM方法能够有效提升网络入侵检测的可靠性。 展开更多
关键词 网络入侵检测 transformer INCEPTION 残差注意力模块 多尺度卷积
在线阅读 下载PDF
基于改进特征金字塔和Transformer的多分支人群密度估计方法
13
作者 杨长敏 李泽滔 《现代电子技术》 北大核心 2026年第3期121-127,共7页
为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度... 为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度的通道和空间加权,从而增强特征表达的准确性;其次,构建Transformer分支,将VGG和CBAM处理后的特征作为输入,利用Transformer的自注意力机制进行全局特征建模;最后,采用IFPN进行多尺度特征融合,通过有效结合不同层级的特征,使模型同时关注目标的局部细节信息和全局上下文。在公开数据集上的实验结果表明,该方法在多个基准测试中的性能优于现有主流方法。在ShanghaiTechPartA数据集上,所提模型的MAE和RMSE分别达到55.6和94.1;在ShanghaiTechPartB数据集上,MAE和RMSE分别达到6.2和10.1;在UCF-QNRF数据集上,MAE和RMSE分别达到83.4和144.9。实验结果验证了该方法在背景噪声和人群尺度不一场景下的鲁棒性,并显著提高了人群密度估计的准确性。 展开更多
关键词 人群密度估计 深度学习 transformer CBAM 特征金字塔网络 多尺度特征融合
在线阅读 下载PDF
基于卷积与交叉条纹Transformer混合编码器的云检测方法
14
作者 吝欣然 王倩 +3 位作者 秦建峰 杨维发 颜国跑 袁文波 《自然资源遥感》 北大核心 2026年第1期75-83,共9页
云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度... 云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度和高度也各不相同。针对云形态复杂多变的特点,该文设计了一种基于卷积与Transformer混合编码器的云检测模型UCT-Net。UCT-Net基于U型网络结构,在编码器部分融合卷积和Transformer编码器来联合提取卫星云图的特征。同时,针对云层特征的多样性,该文设计了一种基于交叉条纹的Transformer模块,以增强对不同形态云的适应性。此外,还提出了一种交叉条纹与卷积融合模块(cross stripe encoder and conv encoder merge module,CCM),有效促进了卷积编码器与交叉条纹Transformer编码器的深度融合。利用GF-1和GF-2卫星数据来源的GF12MS WHU数据集以及Google Earth提供的HRC WHU数据集进行了评估和测试,实验结果表明,UCT-Net在GF12MS WHU和HRC WHU数据集上的精确率分别为92.70%和94.20%,均优于经典语义分割算法,展现了其在云检测任务中的优越性能。 展开更多
关键词 云检测 遥感图像处理 transformer 卷积神经网络 深度学习
在线阅读 下载PDF
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
15
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
在线阅读 下载PDF
基于改进Transformer-无迹卡尔曼滤波器的智能车辆多模态3D目标检测方法
16
作者 张哲宁 刘祯 王化强 《汽车技术》 北大核心 2026年第2期39-47,共9页
为提升智能车辆环境感知目标检测的准确性,提出一种特征融合3D目标检测方法。首先,对Transformer模型进行改进,借助多头自注意力机制,充分考虑数据空间的局部特征信息,并保留不同的特征权重,以提取点云与图像特征;然后,借助无迹卡尔曼... 为提升智能车辆环境感知目标检测的准确性,提出一种特征融合3D目标检测方法。首先,对Transformer模型进行改进,借助多头自注意力机制,充分考虑数据空间的局部特征信息,并保留不同的特征权重,以提取点云与图像特征;然后,借助无迹卡尔曼滤波器(UKF)设计图像与点云多模态融合系统,最终实现3D目标检测;最后,采用KITTI数据集和实车数据集对模型进行训练和推理,并与多种主流算法进行对比。验证结果显示,与应用广泛的截锥卷积网络(F-ConvNet)、视锥点云网络(F-PointNet)等主流多模态融合算法相比,所提出的目标检测模型多类别平均精度分别提升了0.34百分点和3.03百分点,车辆和骑行者对象的检测平均精度分别提升了2.52百分点和9.32百分点,且该模型在实车数据推理中的表现与训练评测结果基本一致。 展开更多
关键词 3D目标检测 智能车辆 改进transformer 多模态融合
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测
17
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
基于超像素引导的Transformer低光图像去噪方法
18
作者 宋泉臻 陈作钧 +1 位作者 秦品乐 曾建潮 《计算机工程》 北大核心 2026年第2期186-196,共11页
现有的低光图像去噪方法主要使用Transformer和卷积神经网络(CNN)的特征提取和去噪机制,会面临两个问题:基于局部窗口的自注意力机制未能充分捕捉图像中的非局部自相似性;通道维度上的自注意力计算未充分利用图像的空间关联性。针对上... 现有的低光图像去噪方法主要使用Transformer和卷积神经网络(CNN)的特征提取和去噪机制,会面临两个问题:基于局部窗口的自注意力机制未能充分捕捉图像中的非局部自相似性;通道维度上的自注意力计算未充分利用图像的空间关联性。针对上述问题,在基于窗口划分的视觉Transformer方法上提出一种超像素引导的策略,其可以自适应地选择相关窗口进行全局交互。首先,设计基于窗口交互的Top-N交叉注意力机制(TNCA),动态选择与目标图像窗口最相似的前N个窗口,并在通道维度上聚合图像窗口的信息,充分考虑图像非局部自相似性;其次,通过超像素分割引导的方式,显著提升窗口内局部特征的表达力,同时在通道维度上增强空间特征的关联性;最后,构建一个层次化的自适应交互超像素引导的Transformer去噪网络(AISGFormer)。实验结果表明,AISGFormer在SIDD和DND真实图像数据集上的峰值信噪比(PSNR)分别为39.98 dB和40.06 dB,与其他先进网络相比分别提升了0.02 dB~14.33 dB和0.02 dB~7.63 dB,AISGFormer更能交互局部与全局的信息和细节,自适应地利用自相似性来抑制区域相似噪声。 展开更多
关键词 低光图像去噪 transformer 交叉注意力 非局部自相似性 真实图像噪声 超像素
在线阅读 下载PDF
基于时空Swin Transformer的流固耦合交互序列图像预测网络
19
作者 邹长军 葛志宇 钟晨曦 《系统仿真学报》 北大核心 2026年第1期112-124,共13页
针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口... 针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口多头自注意力(W-MSA)动态嵌入ConvLSTM输出门,实现时序-空间特征的自适应耦合;设计多级ConvLSTM特征提取框架,分层解析固体与流固耦合的复杂时空关联。在自建流固交互数据集上的实验结果表明:所提方法在各数据集上的PSNR指标均取得第一的优异成绩,在SSIM指标上也处于领先位置,且在涡旋细节保持与边界一致性方面显著优于主流模型。所提方法为动态流体交互场景的高效预测提供了新思路。 展开更多
关键词 深度学习 流体动力学 图像预测 ConvLSTM Swin transformer
在线阅读 下载PDF
基于Transformer的多任务协同监控架构研究
20
作者 牛云鹏 索智文 +3 位作者 王惠伟 屈波 周超逸 张丽芳 《煤炭工程》 北大核心 2026年第1期35-42,共8页
煤矿智能管控面临动态响应滞后和多源数据割裂的挑战,针对传统模型难以捕捉井下瞬态异常和协同分析多模态数据的问题。文章提出基于Transformer的多任务自适应架构(MTA-Transformer),通过跨模态特征融合与共享编码器,统一建模设备振动... 煤矿智能管控面临动态响应滞后和多源数据割裂的挑战,针对传统模型难以捕捉井下瞬态异常和协同分析多模态数据的问题。文章提出基于Transformer的多任务自适应架构(MTA-Transformer),通过跨模态特征融合与共享编码器,统一建模设备振动、瓦斯浓度等数据,实现开采环境的多尺度动态感知,解决对开采环境的动态监控与风险超前预警问题。实验表明,在轴承故障检测任务中,该模型准确率达93.5%,误报率(FAR)为2.0%,响应时间在5 ms内,较传统模型有较大提升;瓦斯浓度预测NRMSE为7.83%,预测区间覆盖概率(PICP)达91.7%,超前预警时效可达6 h。MTA-Transformer为矿山智能化建设提供了可落地的模式。 展开更多
关键词 煤矿智能管控 transformer 多任务协同 故障诊断 瓦斯浓度预测
在线阅读 下载PDF
上一页 1 2 117 下一页 到第
使用帮助 返回顶部