期刊文献+
共找到54,616篇文章
< 1 2 250 >
每页显示 20 50 100
CNN联合多尺度Transformer的高光谱与多光谱图像融合
1
作者 徐光宪 周伟杰 马飞 《红外技术》 北大核心 2025年第1期52-62,共11页
高光谱图像具有丰富的光谱信息,多光谱图像具有精妙的几何特征,融合高分辨率的多光谱图像和低分辨率的高光谱图像可以获取更为全面的遥感数据图像。然而现有的融合网络大多数基于卷积神经网络所设计,对于结构复杂的遥感类图像而言,依赖... 高光谱图像具有丰富的光谱信息,多光谱图像具有精妙的几何特征,融合高分辨率的多光谱图像和低分辨率的高光谱图像可以获取更为全面的遥感数据图像。然而现有的融合网络大多数基于卷积神经网络所设计,对于结构复杂的遥感类图像而言,依赖于核大小的卷积运算,容易导致特征融合阶段缺乏一些全局上下文信息。为保证图像融合的质量,本文提出了一种CNN(Convolutional Neural Network,CNN)联合多尺度transformer网络来实现多光谱和高光谱图像融合,结合了CNN的特征提取能力与transformer的全局建模优势。网络将融合任务分为了两个阶段,特征提取阶段和融合阶段。特征提取阶段,针对图像特性,基于卷积神经网络分别设计了不同模块用于特征提取。融合阶段,通过多尺度transformer模块从局部到全局建立信息间长距离关联,最后通过多层卷积层将特征映射为高分辨率的高光谱图像。经过在CAVE和Harvard数据集的实验结果表明,本文所提算法与其他经典算法相比,能更好地提升融合图像的质量。 展开更多
关键词 高光谱图像 多光谱图像 卷积神经网络 transformer 图像融合
在线阅读 下载PDF
一种融合Transformer的多尺度结构图像去模糊方法
2
作者 郭业才 阳刚 毛湘南 《电光与控制》 北大核心 2025年第3期62-68,共7页
针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模... 针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模块利用双旁路结构将局部特征信息和全局特征信息有效地结合起来,同时简化Transformer以提升计算效率;其次,为了缓解卷积操作缺乏输入内容自适应的缺点,将通道注意力引入到特征融合模块中来动态地学习有用信息;最后,在基准数据集GoPro上,所提方法取得的峰值信噪比为31.87 dB,结构相似度为0.952。实验结果表明,所提方法与主流方法相比能够有效地复原图像细节特征,并且能够提升后续计算机视觉任务的鲁棒性。 展开更多
关键词 图像去模糊 多尺度结构 transformer 卷积神经网络 注意力机制
在线阅读 下载PDF
多尺度特征提取的Transformer短期风电功率预测
3
作者 徐武 范鑫豪 +1 位作者 沈智方 刘洋 《太阳能学报》 北大核心 2025年第2期640-648,共9页
针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了... 针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了特征提取时维数不被破坏;其次,利用融合自注意力机制的长短期记忆网络挖掘气象条件与功率之间的全局依赖关系;最后,融合风电功率序列本身时序特征和气象条件依赖关系,实现短期风电功率预测。实例仿真结果表明,MTPNet模型预测精度得到提升;消融实验证明了模型各模块的可靠性和有效性,具有一定的实用价值。 展开更多
关键词 风电功率预测 transformer 注意力机制 特征提取 长短期记忆网络 维数不变嵌入层
在线阅读 下载PDF
基于轻量化Transformer的高效图像超分辨率算法研究
4
作者 高翔 王凡 胡小鹏 《大连理工大学学报》 北大核心 2025年第2期212-220,共9页
基于Transformer的算法在图像超分辨率领域取得的重要性能突破,得益于其捕捉图像中长程依赖关系的强大能力.然而,繁重的计算成本和高GPU显存消耗限制了其在实际中的应用,于是提出了一种基于轻量化Transformer的高效图像超分辨率算法——... 基于Transformer的算法在图像超分辨率领域取得的重要性能突破,得益于其捕捉图像中长程依赖关系的强大能力.然而,繁重的计算成本和高GPU显存消耗限制了其在实际中的应用,于是提出了一种基于轻量化Transformer的高效图像超分辨率算法——LISRFormer.该算法引入轻量化Transformer,在捕捉长程依赖关系的同时将复杂度从现有的二次方降为线性.通过跨通道计算交叉协方差,得到可应用于大尺寸图像的转置注意力图.层归一化仅作用于查询和键分支,以保留重要的输入特征.此外,还设计了一种高效门控深度卷积前馈网络(EGDFN),作为Transformer中的前馈网络,进一步恢复准确的纹理信息.在基准数据集上进行的大量定量和定性实验表明,该算法在计算成本和图像重建质量方面优于现有轻量化图像超分辨率算法. 展开更多
关键词 图像超分辨率 transformer 轻量化 注意力
在线阅读 下载PDF
基于Swin-AK Transformer的智能手机拍摄图像质量评价方法
5
作者 侯国鹏 董武 +4 位作者 陆利坤 周子镱 马倩 柏振 郑晟辉 《光电工程》 北大核心 2025年第1期116-130,共15页
本文提出了一种基于双交叉注意力融合的Swin-AK Transformer(Swin Transformer based on alterable kernel convolution)和手工特征相结合的智能手机拍摄图像质量评价方法。首先,提取了影响图像质量的手工特征,这些特征可以捕捉到图像... 本文提出了一种基于双交叉注意力融合的Swin-AK Transformer(Swin Transformer based on alterable kernel convolution)和手工特征相结合的智能手机拍摄图像质量评价方法。首先,提取了影响图像质量的手工特征,这些特征可以捕捉到图像中细微的视觉变化;其次,提出了Swin-AK Transformer,增强了模型对局部信息的提取和处理能力。此外,本文设计了双交叉注意力融合模块,结合空间注意力和通道注意力机制,融合了手工特征与深度特征,实现了更加精确的图像质量预测。实验结果表明,在SPAQ和LIVE-C数据集上,皮尔森线性相关系数分别达到0.932和0.885,斯皮尔曼等级排序相关系数分别达到0.929和0.858。上述结果证明了本文提出的方法能够有效地预测智能手机拍摄图像的质量。 展开更多
关键词 图像质量评价 智能手机拍摄图像 Swin transformer 手工特征 空间注意力 通道注意力
在线阅读 下载PDF
基于条件先验Swin Transformer的人脸图像超分辨重建
6
作者 郑方亮 王延年 +1 位作者 廉继红 阮佩 《电子科技》 2025年第2期35-41,共7页
针对现有基于Swin Transformer图像超分辨模型未对人脸图像进行预处理导致最终超分辨结果不佳的问题,文中提出了基于条件先验Swin Transformer的人脸图像超分辨重建方法。该方法利用人脸解析图融合Swin Transformer模型对人脸图像进行... 针对现有基于Swin Transformer图像超分辨模型未对人脸图像进行预处理导致最终超分辨结果不佳的问题,文中提出了基于条件先验Swin Transformer的人脸图像超分辨重建方法。该方法利用人脸解析图融合Swin Transformer模型对人脸图像进行预处理,使用条件先验对人脸超分问题进行优化,采用人脸解析图Parsing Map进行约束从而得到更有价值的先验信息。在深层特征提取阶段,将通道空间注意力机制融合Swin Transformer模块对特征组调整进行速度与精度的平衡。实验结果表明,所提方法在测试集上的峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)为32.21 dB,相较于现有模型具有一定提升。实验证明改进模型更适用于人脸,所生成结果更清晰、更真实,能够还原出更多人脸图像纹理细节。 展开更多
关键词 图像超分辨 Swin transformer 深度学习 条件先验 人脸超分辨 注意力机制 transformer 图像处理 超分重建
在线阅读 下载PDF
基于Swin Transformer和PJF颜色空间的火灾检测算法
7
作者 杜丽霞 梁晓萍 《现代电子技术》 北大核心 2025年第5期147-152,共6页
为了更加准确和可靠地在监控图像中对火灾进行早期监测,以便辅助火焰检测仪器更加高效和准确地检测火焰,文中基于Transformer算法和PJF颜色空间,设计了一种深度学习的火灾图像检测算法。首先,对数据集中的火灾图像数据进行预处理,将图像... 为了更加准确和可靠地在监控图像中对火灾进行早期监测,以便辅助火焰检测仪器更加高效和准确地检测火焰,文中基于Transformer算法和PJF颜色空间,设计了一种深度学习的火灾图像检测算法。首先,对数据集中的火灾图像数据进行预处理,将图像从RGB颜色空间转化为PJF颜色空间,突出显示图像的火焰区域;然后,将预处理后的图像输入到Swin Transformer网络中,过程中采用注意力机制、移动窗口机制、相对位置偏移机制对火灾图像进行特征提取;最后,将提取的图像特征送入全连接层,获取火灾图像的检测结果。实验结果表明:该算法在测试数据集的准确率达到了98.6%。该算法同时采用迁移学习的方法,测试数据集的准确率提升至99.1%,对提高广西森林火灾防控监督效能和实现深度学习智能监测森林和城市视频火灾情况具有现实意义。 展开更多
关键词 transformer PJF颜色空间 火灾检测 图像分类 注意力机制 知识迁移
在线阅读 下载PDF
基于VGAE与Transformer的机器人自主导航优化算法
8
作者 唐敏 朱耀东 +2 位作者 胡蝶 朱永梁 樊紫岩 《微电子学与计算机》 2025年第2期59-67,共9页
在复杂的动态环境中实现智能体的无碰撞自主导航是一项人工智能的重要课题,然而在移动机器人面对多人环境下时,现有的基于深度强化学习方法导航容易出现碰撞、机器人冻结等问题。为实现机器人稳定的自主导航,文章提出利用变分图自编码器... 在复杂的动态环境中实现智能体的无碰撞自主导航是一项人工智能的重要课题,然而在移动机器人面对多人环境下时,现有的基于深度强化学习方法导航容易出现碰撞、机器人冻结等问题。为实现机器人稳定的自主导航,文章提出利用变分图自编码器(Variational Graph Auto-Encoder,VGAE)学习每个代理之间状态的潜在特征,再将潜在特征输入Transformer建模更加全局的空间交互,同时利用强化学习找到最优导航策略。该算法能够计算生成关系图,更好地对人类未来运动能力和随时间演变的动态位置变换进行建模。实验结果表明,算法在连续导航测试中,与开源仿真场景CrowdNav导航成功率与碰撞率相当,导航时间和平均累积奖励皆有所提升,相比现有的导航算法,该算法应用于机器人在人群拥挤环境下的自主导航更加有效。 展开更多
关键词 机器人 导航 深度强化学习 状态预测 transformer
在线阅读 下载PDF
TransTM:A device-free method based on time-streaming multiscale transformer for human activity recognition
9
作者 Yi Liu Weiqing Huang +4 位作者 Shang Jiang Bobai Zhao Shuai Wang Siye Wang Yanfang Zhang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2024年第2期619-628,共10页
RFID-based human activity recognition(HAR)attracts attention due to its convenience,noninvasiveness,and privacy protection.Existing RFID-based HAR methods use modeling,CNN,or LSTM to extract features effectively.Still... RFID-based human activity recognition(HAR)attracts attention due to its convenience,noninvasiveness,and privacy protection.Existing RFID-based HAR methods use modeling,CNN,or LSTM to extract features effectively.Still,they have shortcomings:1)requiring complex hand-crafted data cleaning processes and 2)only addressing single-person activity recognition based on specific RF signals.To solve these problems,this paper proposes a novel device-free method based on Time-streaming Multiscale Transformer called TransTM.This model leverages the Transformer's powerful data fitting capabilities to take raw RFID RSSI data as input without pre-processing.Concretely,we propose a multiscale convolutional hybrid Transformer to capture behavioral features that recognizes singlehuman activities and human-to-human interactions.Compared with existing CNN-and LSTM-based methods,the Transformer-based method has more data fitting power,generalization,and scalability.Furthermore,using RF signals,our method achieves an excellent classification effect on human behaviorbased classification tasks.Experimental results on the actual RFID datasets show that this model achieves a high average recognition accuracy(99.1%).The dataset we collected for detecting RFID-based indoor human activities will be published. 展开更多
关键词 Human activity recognition RFID transformer
在线阅读 下载PDF
基于Transformer和LSTM算法的河套灌区土壤水分预测研究
10
作者 王钥 郑方元 +3 位作者 雍婷 查元源 周龙才 徐祥森 《节水灌溉》 北大核心 2025年第2期1-8,14,共9页
土壤水是土壤中的关键指标,其变化直接影响着作物生长,并影响着水资源利用的管理决策。因此,准确地预测土壤水分有利于对农业水资源进行合理的规划利用。使用深度学习算法进行土壤水分预测在当前的农业、水资源管理和生态学等领域具有... 土壤水是土壤中的关键指标,其变化直接影响着作物生长,并影响着水资源利用的管理决策。因此,准确地预测土壤水分有利于对农业水资源进行合理的规划利用。使用深度学习算法进行土壤水分预测在当前的农业、水资源管理和生态学等领域具有重要性。深度学习算法能够从大规模数据中学习土壤水分的复杂模式和时空关系,为土壤水的准确预测提供了新的机会。为了探索新兴深度学习方法Transformer在土壤水分预测中的有效性,选择河套灌区义长灌域为研究区域,利用地下水位观测数据、气象数据、SMAP土壤水数据等作为训练数据,设置了1、5、10 d共3种数据滞后情况,验证Transformer算法在土壤水时间序列预测任务中的有效性,并与目前广泛应用于时序预测任务中的LSTM进行对比。研究表明Transformer在土壤水分时间序列预测任务中具有更好的预测能力,相比于LSTM,其R^(2)平均提升约0.181,RMSE平均下降27.6%。同时,Transformer在应对滞后变化带来的影响时更具鲁棒性,在3种数据滞后情况下Transformer的预测平均R^(2)分别比LSTM高出了0.121、0.167、0.256,站点平均RMSE分别降低了30.7%、28.6%、23.5%。此外,Transformer对于土壤水序列中的非线性信息的提取能力更强,对于高频振幅的土壤水时间序列Transformer拥有更强的预测能力。 展开更多
关键词 土壤水分预测 深度学习 时序预测 transformer模型 LSTM模型 数据滞后
在线阅读 下载PDF
一种时间-外观能量扩散Transformer的无监督视频异常检测
11
作者 潘振鹏 李志军 +3 位作者 薛超然 黎鑫 吴克伟 谢昭 《微电子学与计算机》 2025年第2期68-76,共9页
无监督视频异常检测,关注从只有视频级标签的视频中,检测出异常事件发生的视频帧。由于没有视频帧标签,会造成该视频中的正常视频帧和异常视频帧难以区分。为了对正常和异常视频帧进行外观和外观特征分析,本文提出一种用于无监督视频异... 无监督视频异常检测,关注从只有视频级标签的视频中,检测出异常事件发生的视频帧。由于没有视频帧标签,会造成该视频中的正常视频帧和异常视频帧难以区分。为了对正常和异常视频帧进行外观和外观特征分析,本文提出一种用于无监督视频异常检测的时间-外观扩散Transformer。该模型中,Transformer编码器用于提取视频帧特征。时间能量扩散模块,使用高斯噪声对时间特征进行扩散,生成加噪后的时间特征集合。该模块使用单步的Monte Carlo采样方法选择出加噪样本,根据加噪样本和原始样本的余弦相似度和均方误差,判断加噪样本是否可信。该模块进一步设计了单次迭代的加噪和多次跨步的采样过程,来充分学习样本特征的更为复杂的时间变化情况。外观能量扩散模块,对外观特征进行单次迭代的加噪和多次跨步的采样过程,学习复杂的外观特征变化。上述的时间、外观能量扩散模块,描述视频帧可信的时间-外观特征,具有较好的互补性,能够有效增强正常和异常样本的区分能力。Transformer解码器用于异常分数的预测。在CUHK Avenue、ShanghaiTech、UCF-Crime和UBnormal这4个数据集上的实验表明,时间-外观扩散Transformer模型优于现有的无监督视频异常检测方法。 展开更多
关键词 无监督视频异常检测 扩散模型 transformer
在线阅读 下载PDF
基于ViT-B深度学习模型的口腔良恶性病变图像分类研究
12
作者 崔宇琛 谢元栋 +3 位作者 吴聿淼 牛凌霄 常路广达 朱宪春 《口腔医学研究》 北大核心 2025年第1期16-20,共5页
目的:基于深度学习算法,对ViT-B模型检测口腔良性和恶性病变图像的性能进行分析,旨在为临床医生早期发现和准确诊断口腔癌提供有效工具。方法:使用包含口腔良性和恶性病变图像的公共数据集,对数据进行预处理和数据增强,按7∶2∶1的比例... 目的:基于深度学习算法,对ViT-B模型检测口腔良性和恶性病变图像的性能进行分析,旨在为临床医生早期发现和准确诊断口腔癌提供有效工具。方法:使用包含口腔良性和恶性病变图像的公共数据集,对数据进行预处理和数据增强,按7∶2∶1的比例将数据随机划分为训练集、验证集和测试集。选取ViT-B、VGG16、ResNet101、DenseNet121和EfficientNetV25种深度学习模型,对模型进行训练和性能比较。通过外部数据对ViT-B模型的泛化能力进行评估,并基于注意力权重的可视化方法对ViT-B模型进行分析。结果:ViT-B在5种模型中分类性能最佳,受试者工作特征曲线下面积为0.9715,准确率为91.00%。该模型可以有效区分口腔良性和恶性病变图像,具有较强的泛化能力和临床实用性。结论:ViT-B模型在口腔良性和恶性病变图像识别中表现良好,可以为口腔癌的早期发现和准确诊断提供支持。 展开更多
关键词 口腔癌 口腔病变 深度学习 vit-B
在线阅读 下载PDF
融合Transformer与1D-CNN的日志异常检测方法
13
作者 赵海鹏 容晓峰 《西安工业大学学报》 2025年第1期138-148,共11页
为了解决现有日志异常检测方法在均衡日志序列的全局趋势和局部特征方面的不足,提出一种基于自编码器的无监督日志异常检测方法。该方法采用多层Transformer堆叠组成编码器,提取具备完整性和全局依赖性的多层融合特征,并通过1D-CNN与全... 为了解决现有日志异常检测方法在均衡日志序列的全局趋势和局部特征方面的不足,提出一种基于自编码器的无监督日志异常检测方法。该方法采用多层Transformer堆叠组成编码器,提取具备完整性和全局依赖性的多层融合特征,并通过1D-CNN与全连接神经网络构成的解码器聚焦数据的局部特征,重构输入数据。实验结果表明,该方法能够准确表示并识别数据特征,分别在三种公开数据集中取得99.7%、97.5%和96.4%的最高F 1值,较基准方法LogAnomaly平均提高7.9%。此外,通过消融实验验证了该方法在特征提取模块的有效性及其对实验结果的影响。 展开更多
关键词 日志数据 异常检测 自编码器 transformer 融合特征
在线阅读 下载PDF
基于Transformer的管制员工作负荷预测
14
作者 关雪琦 卢朝阳 +1 位作者 苟利鹏 张慧子 《航空计算技术》 2025年第1期54-58,共5页
由于民航业持续高速发展,伴随着空中交通流量的快速增长,管制员的工作效率与空中交通流量之间的不平衡问题日益凸显。针对现有管制员负荷计算与预测方法存在无法准确长期预测的问题,提出一种基于Transformer模型的管制员工作负荷预测模... 由于民航业持续高速发展,伴随着空中交通流量的快速增长,管制员的工作效率与空中交通流量之间的不平衡问题日益凸显。针对现有管制员负荷计算与预测方法存在无法准确长期预测的问题,提出一种基于Transformer模型的管制员工作负荷预测模型。该方法在循环神经网络捕捉管制员工作负荷短期依赖特征的基础上,通过编码器-解码器结构有效地捕捉了其长期依赖特征,提取并组合多个特征序列,实现对管制员工作负荷的准确预测。实验结果表明,Transformer模型相比于目前最普遍应用的SVR、随机森林、LightGBM模型,MAPE分别降低了21.47%、12.91%、9.25%,能取得更好的预测效果;该方法在管制员工作负荷预测中具有更加良好的性能和准确性。 展开更多
关键词 空中交通管制 管制员 工作负荷预测 transformer模型 时间序列
在线阅读 下载PDF
基于光流引导Transformer模型的重载铁路监控压缩视频质量增强方法
15
作者 王文斌 宋宗莹 +2 位作者 柴雪松 凌烈鹏 李健超 《铁路计算机应用》 2025年第1期27-33,共7页
重载铁路视频监控系统的不断扩增,使得铁路视频数据急剧增长,对数据存储和传输等能力的要求更高。为此,提出了一种基于光流引导Transformer模型的重载铁路监控压缩视频质量增强方法。通过光流补全网络提取帧间运动信息,指导Transformer... 重载铁路视频监控系统的不断扩增,使得铁路视频数据急剧增长,对数据存储和传输等能力的要求更高。为此,提出了一种基于光流引导Transformer模型的重载铁路监控压缩视频质量增强方法。通过光流补全网络提取帧间运动信息,指导Transformer模型关注视频序列中的重要特征;结合多头自注意力机制和时间空间特征融合策略,有效提取视频帧的时空特征;通过在Transformer模型结构中融入光流引导的特征增强模块,进一步提升视频质量增强的准确性和效率。基于实际采集的重载铁路监控视频数据集的实验结果表明,该方法显著优于现有的视频质量增强方法,具有实用价值。 展开更多
关键词 重载铁路 视频增强 光流 transformer模型 多头自注意力机制
在线阅读 下载PDF
基于卷积视觉Transformer的木薯叶病识别模型
16
作者 谢聪 谢聪 +1 位作者 王天顺 姬少培 《现代电子技术》 北大核心 2025年第3期61-68,共8页
近年来,由于气候变化、室外空气污染物的增加以及全球变暖,木薯叶片病害变得更加普遍,及时和准确地检测木薯叶部病害对于防止其蔓延和确保农业生产的可持续性至关重要。然而,现有的木薯叶病检测模型很容易受到环境背景噪声的影响,这使... 近年来,由于气候变化、室外空气污染物的增加以及全球变暖,木薯叶片病害变得更加普遍,及时和准确地检测木薯叶部病害对于防止其蔓延和确保农业生产的可持续性至关重要。然而,现有的木薯叶病检测模型很容易受到环境背景噪声的影响,这使得其由于无法有效提取出木薯叶病图片的特征,而导致其识别检测精度较低。针对该问题,文中设计了一种卷积视觉Transformer的木薯叶病检测模型——CViT,并提出了一种最小注意力裁剪算法(LeIAP)来选择Transformer模型中每一层最重要的注意力头,以提高模型的性能。该模型在Transformer的基础上利用多头注意力模块来提取图像高级特征,利用软分割标记嵌入捕获局部信息,这不仅可以提高学习到的信息的丰富度,也有利于细粒度的特征学习。此外,该模型还使用了一种焦点角度间隔惩罚损失函数(F⁃Softmax),通过更好地学习类间距离,以改善模型在不同类别疾病数据上的识别精度。实验结果表明,该模型在2021年的Kaggle比赛数据集上的准确率均优于现有的主流模型。 展开更多
关键词 木薯叶病检测 视觉transformer 多头注意力 损失函数 识别精度 最小注意力裁剪
在线阅读 下载PDF
轻量型Swin Transformer与多尺度特征融合相结合的人脸表情识别方法
17
作者 李艳秋 李胜赵 +1 位作者 孙光灵 颜普 《光电工程》 北大核心 2025年第1期24-37,共14页
针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利... 针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利用提出的SPST模块替换掉原Swin Transformer模型第四个stage中的Swin Transformer block模块,来降低模型的参数量,实现模型的轻量化。然后在轻量型模型的第二个stage后嵌入了多尺度特征融合(EMA)模块,通过多尺度特征提取和跨空间信息聚合,有效地增强了模型对人脸表情细节的捕捉能力,从而提高人脸表情识别的准确性和鲁棒性。实验结果表明,所提方法在JAFFE、FERPLUS、RAF-DB和FANE这4个公共数据集上分别达到了97.56%、86.46%、87.29%和70.11%的识别准确率,且相比于原Swin Transformer模型,改进后的模型参数量下降了15.8%,FPS提升了9.6%,在保持模型较低参数量的同时,显著增强了模型的实时性。 展开更多
关键词 表情识别 Swin transformer SPST模块 EMA模块
在线阅读 下载PDF
融合CNN与Transformer的视网膜OCT图像积液分割方法
18
作者 陈宇洋 李峰 《电子科技》 2025年第3期47-59,共13页
针对积液区域尺寸小、形状异质、细节模糊等问题,文中将卷积神经网络(Convolutional Neural Networks,CNN)和Transformer相融合,提出了一种创新的多分支分割网络。该网络包括全卷积路径、Transformer路径和CNN-Transformer融合路径3个... 针对积液区域尺寸小、形状异质、细节模糊等问题,文中将卷积神经网络(Convolutional Neural Networks,CNN)和Transformer相融合,提出了一种创新的多分支分割网络。该网络包括全卷积路径、Transformer路径和CNN-Transformer融合路径3个关键路径。全卷积路径用于捕获病变区域的细节特征,Transformer路径提取了具有长范围依赖的多尺度非局部特征信息。融合路径同时利用了CNN和Transformer的优势弥补其他分支的不足之处,通过预测头整合3个分支的特征生成最终的分割图。在Kermany数据集、UMN数据集和DUKE数据集上针对视网膜内积液和视网膜下积液进行了视网膜积液分割性能测试。实验结果表明,所提方法的Dice系数为86.63%,交并比为77.02%,灵敏度为89.47%,精确度为85.51%,证明了其有效性,为视网膜积液自动分割问题提供了一种可行的解决方案。 展开更多
关键词 视网膜OCT图像 卷积神经网络 transformer 分割网络 IRF SRF 视网膜积液 注意力机制
在线阅读 下载PDF
基于Transformer的高光谱图像域适应分类
19
作者 何文强 李照奎 房卓群 《激光杂志》 北大核心 2025年第2期141-148,共8页
针对跨域高光谱图像分类中的光谱偏移和光谱冗余问题,提出了一种基于Transformer的高光谱图像域适应分类方法。该方法结合逐像素高光谱长波段分块策略和基于邻域相关性的中心像元特征提取策略,有效提取高光谱图像中的局部-长程光谱相关... 针对跨域高光谱图像分类中的光谱偏移和光谱冗余问题,提出了一种基于Transformer的高光谱图像域适应分类方法。该方法结合逐像素高光谱长波段分块策略和基于邻域相关性的中心像元特征提取策略,有效提取高光谱图像中的局部-长程光谱相关性特征和中心像元信息,最后通过双分类器架构实现知识的有效迁移。在Houston和YRD数据集上的实验结果证实了所提方法的有效性。本方法的提出为高光谱图像的域适应分类研究提供了新的视角和技术路径。 展开更多
关键词 高光谱图像 遥感 分类 域适应 transformer
在线阅读 下载PDF
基于Transformer模型的水电机组轴承温度预测
20
作者 金东兵 陈泽阳 +3 位作者 三梅英 赵社强 刘伟 白永福 《水电站机电技术》 2025年第1期36-39,97,129,共6页
水电机组在运行过程中,轴承温度会随着机组的工况变化而变化,是机组状态监测系统中的重要数据之一。然而影响轴承温度的参数指标众多,有环境温度、冷却器冷却性能、机组负荷等,其工业机理模型十分复杂,对其预测难度极大。为及时准确掌... 水电机组在运行过程中,轴承温度会随着机组的工况变化而变化,是机组状态监测系统中的重要数据之一。然而影响轴承温度的参数指标众多,有环境温度、冷却器冷却性能、机组负荷等,其工业机理模型十分复杂,对其预测难度极大。为及时准确掌握机组的运行状态,需要对轴承温度进行预测。本文选取某个水电机组的实际运行数据,基于Transformer模型对水电机组的轴承温度进行预测,该研究可以应用于水电机组的趋势分析、状态评价及早期故障预测,避免烧瓦事故的发生,为水电机组的安全稳定运行提供数据支撑。 展开更多
关键词 水电机组 轴承温度 transformer模型 预测
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部