期刊文献+
共找到1,838篇文章
< 1 2 92 >
每页显示 20 50 100
基于融合卷积Transformer的航空发动机故障诊断 被引量:1
1
作者 赵洪利 杨佳强 《北京航空航天大学学报》 北大核心 2025年第4期1117-1126,共10页
航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊... 航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊断方法。利用自注意力机制提取有用特征,抑制冗余信息,并将最大池化层引入Transformer模型中,进一步降低模型内存消耗及参数量,缓解过拟合现象。采用基于GasTurb建模的涡扇发动机仿真数据集进行验证,结果与Transformer模型和反向传播(BP)神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等传统深度学习模型相比,准确率分别提高了6.552%和28.117%、13.189%、10.29%,证明了所提方法的有效性,可为航空发动机故障诊断提供一定的参考。 展开更多
关键词 航空发动机 故障诊断 自注意力机制 融合卷积transformer 深度神经网络
在线阅读 下载PDF
基于多尺度卷积融合时间序列Transformer的复合电能质量扰动识别
2
作者 李贝奥 李开成 +3 位作者 肖贤贵 李旋 罗溢 尹晨 《电网技术》 北大核心 2025年第6期2511-2520,I0102,I0103,共12页
随着光伏、风电等新能源占比不断增加,以及大量新型电力电子设备等非线性负载接入电网,电力系统中的电能质量扰动事件(power quality disturbances,PQDs)频发。为了提高复合电能质量扰动识别准确率,该文提出一种多尺度卷积融合时间序列T... 随着光伏、风电等新能源占比不断增加,以及大量新型电力电子设备等非线性负载接入电网,电力系统中的电能质量扰动事件(power quality disturbances,PQDs)频发。为了提高复合电能质量扰动识别准确率,该文提出一种多尺度卷积融合时间序列Transformer模型(multi-scale convolution fusion time series transformer,MCF-TST)。首先,使用3个不同尺度的卷积核对输入的原始电能质量扰动一维时序信号进行多通道卷积操作,初步提取扰动信号在不同时间尺度的多维特征;然后经过时间序列Transformer中的多头注意力机制提取扰动信号更加深层次的暂态局部特征和周期性全局特征;最后通过全连接层和softmax分类器输出识别结果。仿真和硬件实验结果表明,该文所提模型能够在保留信号的原始一维时序特征的同时提取更高维度的深层特征,对多种复合电能质量扰动识别准确率高,具有良好的抗噪能力和泛化性能。 展开更多
关键词 电能质量扰动 多尺度卷积 时间序列transformer 多头注意力机制 扰动识别
在线阅读 下载PDF
融合条形卷积和Transformer的风机叶片裂纹检测研究
3
作者 黄启昀 李黄强 +2 位作者 舒征宇 李欣 付军军 《现代电子技术》 北大核心 2025年第14期123-128,共6页
针对风机叶片早期出现的浅色、细小裂纹难以识别问题,提出一种融合条形卷积和Transformer的风机叶片裂纹检测方法。首先基于不同方向条形卷积构建多方向裂纹特征增强模块,在不同尺度下增强网络对裂纹特征的提取能力;其次,在Transformer... 针对风机叶片早期出现的浅色、细小裂纹难以识别问题,提出一种融合条形卷积和Transformer的风机叶片裂纹检测方法。首先基于不同方向条形卷积构建多方向裂纹特征增强模块,在不同尺度下增强网络对裂纹特征的提取能力;其次,在Transformer中引入非线性无激活网络,以降低Transformer在利用高分辨率图像进行检测任务时的计算复杂度;最后结合Transformer与条形卷积的优势,构建一种四级对称编码-解码器网络,完成叶片裂纹缺陷检测任务。测试结果表明,该方法在自制数据集上的mPA值和mIoU值分别达到86.87%和79.54%,且网络的训练速率达到13.24幅/s,说明风机叶片裂纹检测方法在检测性能与检测速率上均具有良好的效果。 展开更多
关键词 风机叶片 裂纹检测 多尺度特征 条形卷积 transformer 编码-解码器网络
在线阅读 下载PDF
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
4
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 transformer 注意力模块 梯度融合
在线阅读 下载PDF
双向自回归Transformer与快速傅里叶卷积增强的壁画修复 被引量:1
5
作者 陈永 张世龙 杜婉君 《湖南大学学报(自然科学版)》 北大核心 2025年第4期1-15,共15页
针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer... 针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer结构的全局语义特征修复模块,利用双向自回归机制与掩码语言模型(masked language modeling,MLM),提出改进的多头注意力全局语义壁画修复模块,提高对全局语义特征的修复能力.然后,构建了由门控卷积和残差模块组成的全局语义增强模块,增强全局语义特征一致性约束.最后,设计局部细节修复模块,采用大核注意力机制(large kernel attention,LKA)与快速傅里叶卷积提高细节特征的捕获能力,同时减少局部细节信息的丢失,提升修复壁画局部和整体特征的一致性.通过对敦煌壁画数字化修复实验,结果表明,所提算法修复性能更优,客观评价指标均优于比较算法. 展开更多
关键词 壁画修复 双向自回归transformer 掩码语言模型 快速傅里叶卷积 语义增强
在线阅读 下载PDF
基于卷积和Transformer神经网络架构搜索的脑胶质瘤多组织分割网络 被引量:1
6
作者 陶永鹏 柏诗淇 周正文 《计算机应用》 北大核心 2025年第7期2378-2386,共9页
脑胶质瘤在磁共振成像(MRI)图像中的形状大小变化大、边界模糊且组织结构复杂,这些特点导致了脑肿瘤分割任务的挑战性,通常这种任务需要具备深厚专业知识的研究人员设计复杂定制的网络模型才能完成。这一过程不仅耗时,而且需要大量的人... 脑胶质瘤在磁共振成像(MRI)图像中的形状大小变化大、边界模糊且组织结构复杂,这些特点导致了脑肿瘤分割任务的挑战性,通常这种任务需要具备深厚专业知识的研究人员设计复杂定制的网络模型才能完成。这一过程不仅耗时,而且需要大量的人力资源。为了简化网络设计流程并自动获取最优的网络结构,提出一种基于卷积和Transformer神经网络架构搜索的脑胶质瘤多组织分割网络(NASCT-Net),以在构建用于多模态MRI脑肿瘤分割的网络架构的过程中,提高分割的精确度。首先,将神经架构搜索(NAS)技术应用于编码器的构建,形成可堆叠的NAS编解码模块,以自动优化适用于脑胶质瘤精准分割的网络架构;其次,在编码器底层集成基于Transformer的特征编码模块,以增强对肿瘤各组之间的相对位置和全局信息的表征能力;最后,通过构建体积加权Dice损失函数(VWDiceLoss),解决前景与背景的不平衡问题。在BraTS2019脑肿瘤数据集上与Swin-Unet等方法进行比较的实验结果表明,NASCT-Net的平均Dice相似系数(DSC)提高了0.009,同时平均Hausdorff距离(HD)降低了1.831 mm,验证了NASCT-Net在提高脑肿瘤多组织分割精度方面的有效性。 展开更多
关键词 网络架构 神经网络架构搜索 脑肿瘤分割 卷积神经网络 transformer
在线阅读 下载PDF
CNN联合多尺度Transformer的高光谱与多光谱图像融合
7
作者 徐光宪 周伟杰 马飞 《红外技术》 北大核心 2025年第1期52-62,共11页
高光谱图像具有丰富的光谱信息,多光谱图像具有精妙的几何特征,融合高分辨率的多光谱图像和低分辨率的高光谱图像可以获取更为全面的遥感数据图像。然而现有的融合网络大多数基于卷积神经网络所设计,对于结构复杂的遥感类图像而言,依赖... 高光谱图像具有丰富的光谱信息,多光谱图像具有精妙的几何特征,融合高分辨率的多光谱图像和低分辨率的高光谱图像可以获取更为全面的遥感数据图像。然而现有的融合网络大多数基于卷积神经网络所设计,对于结构复杂的遥感类图像而言,依赖于核大小的卷积运算,容易导致特征融合阶段缺乏一些全局上下文信息。为保证图像融合的质量,本文提出了一种CNN(Convolutional Neural Network,CNN)联合多尺度transformer网络来实现多光谱和高光谱图像融合,结合了CNN的特征提取能力与transformer的全局建模优势。网络将融合任务分为了两个阶段,特征提取阶段和融合阶段。特征提取阶段,针对图像特性,基于卷积神经网络分别设计了不同模块用于特征提取。融合阶段,通过多尺度transformer模块从局部到全局建立信息间长距离关联,最后通过多层卷积层将特征映射为高分辨率的高光谱图像。经过在CAVE和Harvard数据集的实验结果表明,本文所提算法与其他经典算法相比,能更好地提升融合图像的质量。 展开更多
关键词 高光谱图像 多光谱图像 卷积神经网络 transformer 图像融合
在线阅读 下载PDF
基于CNN和Transformer双流融合的人体姿态估计
8
作者 李鑫 张丹 +2 位作者 郭新 汪松 陈恩庆 《计算机工程与应用》 北大核心 2025年第5期187-199,共13页
卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transfor... 卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transformer处理全局信息的优势,构建一种CNN-Transformer双流的并行网络架构来聚合丰富的特征信息。由于传统Transformer的输入需要将图片展平为多个patch,不利于提取对位置敏感的人体结构信息,因此将其多头注意力结构进行改进,使模型输入能够保持原始2D特征图的结构;同时提出特征耦合模块融合两个分支不同分辨率下的特征,最大限度地保留局部特征与全局特征;最后引入改进后的坐标注意力模块(coordinate attention),进一步提升网络的特征提取能力。在COCO和MPII数据集上的实验结果表明所提模型相对目前主流模型具有更高的检测精度,从而说明所提模型能够充分捕获并融合人体姿态中的局部和全局特征。 展开更多
关键词 卷积神经网络 transformer 局部特征 全局特征 2D特征图 特征耦合
在线阅读 下载PDF
用于红外与微光图像融合的目标差分注意力和Transformer算法
9
作者 陈广秋 代宇航 +1 位作者 段锦 黄丹丹 《电子测量与仪器学报》 北大核心 2025年第5期103-116,共14页
针对当前红外与微光图像融合算法中易出现光谱信息缺失、目标边缘模糊等问题,提出了用于红外与微光图像融合的目标差分注意力和Transformer的融合算法。首先,利用残差结构构造一种微光重构网络,并利用VGG-16构建感知损失,最大程度保留... 针对当前红外与微光图像融合算法中易出现光谱信息缺失、目标边缘模糊等问题,提出了用于红外与微光图像融合的目标差分注意力和Transformer的融合算法。首先,利用残差结构构造一种微光重构网络,并利用VGG-16构建感知损失,最大程度保留微光图像中的背景纹理信息和亮度信息;而后,将卷积神经网络(CNN)与Transformer结合构建特征提取网络,提取图像的完整特征;同时,在目标差分注意力模块中,对红外图像和微光图像进行差分运算和特征提取,得到的红外差分图像通过通道注意力机制对目标特征进行增强,再与CNN特征提取网络的输出特征图进行逐元素相加,增强红外目标特征;然后,通过纹理保留模块捕捉特征的高频信息和低频信息,提升纹理细节的保留度;最后,利用特征重建网络重构出融合图像。实验结果表明,融合结果不仅更符合人眼视觉系统,在客观评价指标中MI和VIF分别比其他融合方法提升了44.6%和21.2%。 展开更多
关键词 深度学习 图像融合 红外图像 微光图像 CNN transformer
在线阅读 下载PDF
融合CNN与Transformer的遥感影像道路信息提取
10
作者 曲海成 王莹 +1 位作者 刘腊梅 郝明 《自然资源遥感》 北大核心 2025年第1期38-45,共8页
利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络... 利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络(convolutional neural networks,CNN)和Transformer中,然后,采用了双分支融合模块(shuffle attention dual branch fusion block,SA-DBF)来有效地结合这2个分支学习到的特征,从而实现全局信息与局部信息的融合。其中,双分支融合模块通过细粒度交互对这2个分支的特征进行建模,同时利用多重注意力机制充分提取特征图的通道和空间信息,并抑制掉无效的噪声信息。在公共数据集Massachusetts道路数据集上对模型进行测试,准确率(overall accuracy,OA)、交并比(intersection over union,IoU)和F 1等评价指标分别达到98.04%,88.03%和65.13%;与主流方法U-Net和TransRoadNet等进行比较,IoU分别提升了2.01个百分点和1.42个百分点,实验结果表明所提出的方法优于其他的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 级联神经网络 transformer 特征融合 注意力机制
在线阅读 下载PDF
融合Gabor滤波与Transformer的图像水印方法
11
作者 张天骐 谭霜 +1 位作者 沈夕文 唐娟 《信号处理》 北大核心 2025年第4期694-705,共12页
图像水印在数字版权保护和身份验证领域中具有关键意义,是保护图像信息安全和确保数据可信性的重要技术手段。目前,大多数已发表的基于深度学习的图像水印方法都是基于卷积神经网络设计的,此类方法存在无法充分捕捉图像的全局信息和细... 图像水印在数字版权保护和身份验证领域中具有关键意义,是保护图像信息安全和确保数据可信性的重要技术手段。目前,大多数已发表的基于深度学习的图像水印方法都是基于卷积神经网络设计的,此类方法存在无法充分捕捉图像的全局信息和细节信息,以及忽略图像高频信息具备稳定和不可感知特点等问题,为了克服上述问题,该论文提出一种融合Gabor滤波与Transformer的图像水印模型。该模型由嵌入网络、提取网络和判别网络组成:在嵌入网络设计了水印信息处理模块对水印信息引入冗余和扩展操作,以增加水印信息在传输过程中的鲁棒性;在嵌入网络引入Gabor滤波的思想在特征提取模块通过卷积分支来捕捉局部特征,通过Transformer分支捕捉全局信息,来充分挖掘图像的稳定特征;在提取网络中融合标准卷积和差分卷积,来准确感知图像的细微信息,进而提高水印的提取精度;引入判别网络与嵌入网络形成对抗训练关系,评估生成水印图像的真实性和质量,从而提升嵌入网络生成水印图像的视觉质量。分别在COCO、ImageNet和VOC2012数据集下进行综合对比实验,结果表明,该文方法针对不可感知性和鲁棒性,相比于相关水印模型取得了更优的指标,具有较为突出的增强性能与泛化能力。此外,还进行了相关的消融实验,结果进一步验证了该模型的可靠性和有效性。 展开更多
关键词 图像水印 不可感知 鲁棒性 卷积神经网络 transformer
在线阅读 下载PDF
电网N-1下融合CNN与Transformer的综合能源系统静态安全校核
12
作者 陈厚合 丁唯一 +2 位作者 刘光明 李雪 张儒峰 《电力自动化设备》 北大核心 2025年第5期1-9,18,共10页
风光等新能源高比例渗透衍生出大量的源-荷场景,电-气综合能源系统(IEGS)的N-1安全校核面临计算挑战。深度学习技术在处理大量数据时具备显著优势,为解决该问题提供了新的思路。将评价电力系统安全性的Hyper-box和Hyper-ellipse判据推... 风光等新能源高比例渗透衍生出大量的源-荷场景,电-气综合能源系统(IEGS)的N-1安全校核面临计算挑战。深度学习技术在处理大量数据时具备显著优势,为解决该问题提供了新的思路。将评价电力系统安全性的Hyper-box和Hyper-ellipse判据推广到天然气系统,并形成IEGS综合安全指标以划分子系统的运行状态;构建卷积神经网络(CNN)-Transformer神经网络以适应量测数据与校核目标的非线性关系,实现快速校核;考虑到系统数据的量纲和数值差异大以及系统状态离散化的特点,分别对数据进行Z-score标准化和独热编码数值化以提升校核精度,并设计改进焦点损失函数以进一步提取不同的场景下天然气系统运行状态的变化规律。以含高比例新能源的综合能源系统(E5G5、E39G20系统)为算例,验证所提方法的高效性和准确性。 展开更多
关键词 电-气综合能源系统 N-1安全校核 深度学习 卷积神经网络 transformer神经网络 改进焦点损失函数
在线阅读 下载PDF
基于双流特征交叉融合Efficient Transformer的人脸表情识别
13
作者 党宏社 孟饶辰 高宛蓉 《计算机工程与应用》 北大核心 2025年第15期251-257,共7页
面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet... 面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet分别提取人脸表情的图像和关键点的多尺度特征,同时采用通道注意力机制来增强关键特征并减少参数量;引入了交叉融合高效多头自注意力机制(cross fusion efficient multi-head self-attention,CFEMSA),对相同尺度的双流特征进行交叉融合,以突出面部显著特征;最后采用特征金字塔结构对不同尺度的交叉融合结果进行多尺度融合,以提高识别的准确性。提出的方法在RAF-DB、AffecNet-7和AffecNet-8数据集上的识别准确率分别为91.82%、67.46%和63.65%,实验结果证明该方法有效缓解了类间相似性和类内差异所引起的识别准确率低的问题。 展开更多
关键词 面部表情识别 Efficient transformer 交叉融合 多尺度特征 特征融合
在线阅读 下载PDF
一种融合Transformer的多尺度结构图像去模糊方法
14
作者 郭业才 阳刚 毛湘南 《电光与控制》 北大核心 2025年第3期62-68,共7页
针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模... 针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模块利用双旁路结构将局部特征信息和全局特征信息有效地结合起来,同时简化Transformer以提升计算效率;其次,为了缓解卷积操作缺乏输入内容自适应的缺点,将通道注意力引入到特征融合模块中来动态地学习有用信息;最后,在基准数据集GoPro上,所提方法取得的峰值信噪比为31.87 dB,结构相似度为0.952。实验结果表明,所提方法与主流方法相比能够有效地复原图像细节特征,并且能够提升后续计算机视觉任务的鲁棒性。 展开更多
关键词 图像去模糊 多尺度结构 transformer 卷积神经网络 注意力机制
在线阅读 下载PDF
融合卷积注意力和Transformer架构的行人重识别方法 被引量:2
15
作者 王静 李沛橦 +2 位作者 赵容锋 张云 马振玲 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期466-476,共11页
行人重识别技术是智能安防系统中的重要方法之一,为构建一个适用各种复杂场景的行人重识别模型,基于现有的卷积神经网络和Transformer模型,提出一种融合卷积注意力和Transformer(FCAT)架构的方法,以增强Transformer对局部细节信息的关... 行人重识别技术是智能安防系统中的重要方法之一,为构建一个适用各种复杂场景的行人重识别模型,基于现有的卷积神经网络和Transformer模型,提出一种融合卷积注意力和Transformer(FCAT)架构的方法,以增强Transformer对局部细节信息的关注。所提方法主要将卷积空间注意力和通道注意力嵌入Transformer架构中,分别加强对图像中重要区域的关注和对重要通道特征的关注,以进一步提高Transformer架构对局部细节特征的提取能力。在3个公开行人重识别数据集上的对比消融实验证明,所提方法在非遮挡数据集上取得了与现有方法相当的结果,在遮挡数据集上的性能得到显著提升。所提方法更加轻量化,在不增加额外计算量和模型参数的情况下,推理速度得到了提升。 展开更多
关键词 行人重识别 深度学习 卷积神经网络 transformer 注意力机制
在线阅读 下载PDF
多尺度卷积神经网络融合Transformer的竹材缺陷识别方法 被引量:1
16
作者 杨松 张锐 朱良宽 《林业工程学报》 CSCD 北大核心 2024年第5期126-133,共8页
在竹材缺陷识别的研究中,竹片形状、缺陷部位颜色深浅及裂纹大小差异都是制约模型识别准确率的关键。针对上述问题,提出一种适用于中小数据集的多尺度卷积神经网络融合Transformer的竹材缺陷识别方法,以更好地提高竹材缺陷识别的准确率... 在竹材缺陷识别的研究中,竹片形状、缺陷部位颜色深浅及裂纹大小差异都是制约模型识别准确率的关键。针对上述问题,提出一种适用于中小数据集的多尺度卷积神经网络融合Transformer的竹材缺陷识别方法,以更好地提高竹材缺陷识别的准确率。该方法在卷积神经网络的主干上进行改进,从获取不同尺度语义信息的角度出发,首先利用卷积神经网络在不同尺度的特征图上捕捉图像局部语义信息,然后将不同尺度的语义特征映射为特征符号,同时引入Sinkhorn分词器对不同阶段的卷积神经网络特征符号化以减少特征冗余,再通过Transformer对特征符号之间的关系进行建模以学习图像全局语义信息。试验结果表明,与VGG16、ResNet50、DenseNet121、ViT这4种深度学习模型相比,基于多尺度卷积神经网络融合Transformer的方法能够更高效地提高竹材缺陷识别模型的性能,在竹材缺陷图像数据集上的平均识别准确率达到了99.13%。该方法识别速度更快、精度更高,且具有良好的鲁棒性,为竹材缺陷的实时自动识别提供了新思路,同时也验证了所提出方法的有效性。 展开更多
关键词 竹材缺陷识别 多尺度 卷积神经网络 transformer Sinkhorn分词器
在线阅读 下载PDF
基于扩张卷积和Transformer的视听融合语音分离方法 被引量:2
17
作者 刘宏清 谢奇洲 +1 位作者 赵宇 周翊 《信号处理》 CSCD 北大核心 2024年第7期1208-1217,共10页
为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征... 为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征中的长期依赖关系,并强化网络对输入上下文信息的理解,本文提出了一种基于一维扩张卷积与Transformer的时域视听融合语音分离模型。将基于频域的传统视听融合语音分离方法应用到时域中,避免了时频变换带来的信息损失和相位重构问题。所提网络架构包含四个模块:一个视觉特征提取网络,用于从视频帧中提取唇部嵌入特征;一个音频编码器,用于将混合语音转换为特征表示;一个多模态分离网络,主要由音频子网络、视频子网络,以及Transformer网络组成,用于利用视觉和音频特征进行语音分离;以及一个音频解码器,用于将分离后的特征还原为干净的语音。本文使用LRS2数据集生成的包含两个说话者混合语音的数据集。实验结果表明,所提出的网络在尺度不变信噪比改进(Scale-Invariant Signal-to-Noise Ratio Improvement,SISNRi)与信号失真比改进(Signal-to-Distortion Ratio Improvement,SDRi)这两种指标上分别达到14.0 dB与14.3 dB,较纯音频分离模型和普适的视听融合分离模型有明显的性能提升。 展开更多
关键词 语音分离 视听融合 多头自注意力机制 扩张卷积
在线阅读 下载PDF
融合深度卷积神经网络和Swin Transformer的露天矿遥感图像超分辨率重建 被引量:1
18
作者 聂雅琳 王海军 +1 位作者 石念峰 刘保罗 《金属矿山》 北大核心 2024年第12期240-245,共6页
针对现有露天矿遥感图像超分辨率重建模型提取特征能力弱、特征利用不充分的问题,提出了一种融合深度卷积神经网络和Swin Transformer网络的露天矿遥感图像超分辨率重建方法。首先,利用卷积神经网络和Swin Transformer网络将露天矿遥感... 针对现有露天矿遥感图像超分辨率重建模型提取特征能力弱、特征利用不充分的问题,提出了一种融合深度卷积神经网络和Swin Transformer网络的露天矿遥感图像超分辨率重建方法。首先,利用卷积神经网络和Swin Transformer网络将露天矿遥感图像映射到全局和局部特征空间,充分提取遥感图像的深层特征;然后,构造了一种基于注意力机制的多尺度特征融合网络,实现遥感图像局部和全局特征的深度融合,强化有效特征表达的区分能力;最后,将深度融合特征作为超分辨率解码模块的输入,重建出高分辨率的露天矿遥感图像。通过在自建露天矿区图像数据集和开源数据集上进行测试,试验结果表明:与当前主流的图像超分辨率重建算法相比,所提方法重构出的超分辨率图像具有较好的视觉感知,在均方根误差方面也低于其他对比方法。 展开更多
关键词 露天矿 超分辨率重建 深度卷积神经网络 Swin transformer
在线阅读 下载PDF
基于视觉Transformer的运动特征选择融合微表情识别算法 被引量:1
19
作者 杜含月 张鹏 +3 位作者 林强 李晓桐 徐森 贲晛烨 《信号处理》 北大核心 2025年第2期267-278,共12页
微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,... 微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TVL1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。 展开更多
关键词 微表情识别 特征选择与融合 交叉注意力机制 视觉transformer
在线阅读 下载PDF
三维卷积与Transformer支持下联合空谱特征的高光谱影像分类 被引量:1
20
作者 何光 吴田军 《计算机工程与应用》 北大核心 2025年第2期259-272,共14页
由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取... 由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取全局上下文信息。如何实现CNN和Transformer的技术耦合并充分利用空间信息和光谱信息进行高光谱遥感影像分类是一个重要的待研问题。鉴于此,提出一种新的基于三维卷积和Transformer的高光谱遥感影像分类方法,尝试联合空谱特征实现解译能力的提升。使用主成分分析方法对高光谱遥感影像沿垂直方向降维;用非负矩阵分解算法对降维后遥感影像沿水平方向进行空间特征提取,将两种工具处理后遥感影像进行拼接,以充分保留信息;再用三维卷积核对拼接后遥感影像进行空间特征和光谱特征的综合提取;用Transformer的注意力机制对提取空间信息和光谱信息的遥感影像序列建立长距离依赖关系并使用多层感知机完成分类任务。实验表明,所提方法在WHU-Hi龙口、汉川、洪湖以及雄安新区马蹄湾村数据集上均表现出比对比方法更优异的分类性能,表明该方法具有一定的泛化性和稳健性。 展开更多
关键词 非负矩阵分解 特征融合 三维卷积 空谱联合 transformer 高光谱遥感影像分类
在线阅读 下载PDF
上一页 1 2 92 下一页 到第
使用帮助 返回顶部