期刊文献+
共找到3,082篇文章
< 1 2 155 >
每页显示 20 50 100
Spectral matching algorithm based on nonsubsampled contourlet transform and scale-invariant feature transform 被引量:4
1
作者 Dong Liang Pu Yan +2 位作者 Ming Zhu Yizheng Fan Kui Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2012年第3期453-459,共7页
A new spectral matching algorithm is proposed by us- ing nonsubsampled contourlet transform and scale-invariant fea- ture transform. The nonsubsampled contourlet transform is used to decompose an image into a low freq... A new spectral matching algorithm is proposed by us- ing nonsubsampled contourlet transform and scale-invariant fea- ture transform. The nonsubsampled contourlet transform is used to decompose an image into a low frequency image and several high frequency images, and the scale-invariant feature transform is employed to extract feature points from the low frequency im- age. A proximity matrix is constructed for the feature points of two related images. By singular value decomposition of the proximity matrix, a matching matrix (or matching result) reflecting the match- ing degree among feature points is obtained. Experimental results indicate that the proposed algorithm can reduce time complexity and possess a higher accuracy. 展开更多
关键词 point pattern matching nonsubsampled contourlet transform scale-invariant feature transform spectral algorithm.
在线阅读 下载PDF
Digital watermarking algorithm based on scale-invariant feature regions in non-subsampled contourlet transform domain 被引量:8
2
作者 Jian Zhao Na Zhang +1 位作者 Jian Jia Huanwei Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2015年第6期1310-1315,共6页
Contraposing the need of the robust digital watermark for the copyright protection field, a new digital watermarking algorithm in the non-subsampled contourlet transform (NSCT) domain is proposed. The largest energy... Contraposing the need of the robust digital watermark for the copyright protection field, a new digital watermarking algorithm in the non-subsampled contourlet transform (NSCT) domain is proposed. The largest energy sub-band after NSCT is selected to embed watermark. The watermark is embedded into scaleinvariant feature transform (SIFT) regions. During embedding, the initial region is divided into some cirque sub-regions with the same area, and each watermark bit is embedded into one sub-region. Extensive simulation results and comparisons show that the algorithm gets a good trade-off of invisibility, robustness and capacity, thus obtaining good quality of the image while being able to effectively resist common image processing, and geometric and combo attacks, and normalized similarity is almost all reached. 展开更多
关键词 multi-scale geometric analysis (MGA) non-subsampled contourlet transform (NSCT) scale-invariant featureregion.
在线阅读 下载PDF
基于Transformer-FNN和无人机高光谱遥感技术的棉花黄萎病危害等级分类研究 被引量:1
3
作者 廖娟 梁业雄 +7 位作者 姜锐 邢赫 何欣颖 王辉 曾浩求 何松炜 唐赛欧 罗锡文 《农业机械学报》 北大核心 2025年第2期240-251,共12页
针对目前使用无人机识别棉花黄萎病危害等级时,光谱数据冗余度高和传统机器学习模型识别精度不足等问题,采用无人机搭载Nano-Hyperspec高光谱成像仪采集棉田高光谱图像,通过探究棉花冠层对不同黄萎病危害等级的光谱响应特征,利用最优植... 针对目前使用无人机识别棉花黄萎病危害等级时,光谱数据冗余度高和传统机器学习模型识别精度不足等问题,采用无人机搭载Nano-Hyperspec高光谱成像仪采集棉田高光谱图像,通过探究棉花冠层对不同黄萎病危害等级的光谱响应特征,利用最优植被指数组合建立一种适用于黄萎病危害等级分类的监测模型,实现棉花黄萎病危害等级的精准分类。首先,利用最小冗余最大相关算法(Minimum redundancy maximum relevance,mRMR)对17种潜在的植被指数和270个光谱波段进行特征重要性排序,将mRMR筛选得到的特征,通过逐步递增分组的方式输入至极限梯度提升模型(eXtreme gradient boosting,XGBoost),确定与黄萎病危害等级相关性最高的植被指数和光谱特征波段。然后,基于Transformer架构和前馈神经网络(Feedforward neural network,FNN)构建Transformer-FNN棉花黄萎病危害等级分类模型,将植被指数与光谱特征波段输入Transformer-FNN模型进行分类识别,对比了植被指数与光谱特征波段对棉花黄萎病危害等级分类识别的准确性。最后,利用后向传播神经网络(Back propagation neural network,BPNN)、Transformer和支持向量机(Support vector machine,SVM)构建棉花黄萎病危害等级分类模型,并对这4种分类模型进行精度验证与对比分析。结果表明:棉花黄萎病等级分类的最优植被指数组合为MSR和TVI,最优特征波段组合为430、439、488、566、697、722、742、764、769、782、822、831、858、873、878、893、909、985 nm。基于Transformer-FNN模型,植被指数对黄萎病危害等级的总体分类精度为95.6%,较光谱特征波段的总体分类精度89.4%提高6.2个百分点。基于植被指数,Transformer-FNN模型对黄萎病危害等级的分类识别率比BPNN模型提高11.2个百分点,比Transformer模型提高17.2个百分点,比SVM模型提高30.8个百分点。研究提出了一种通过植被指数进行棉花黄萎病高精度监测方法,可为大面积棉花黄萎病精确监测提供有效措施。 展开更多
关键词 棉花黄萎病 transformer-FNN 特征组合 mRMR-XGBoost 高光谱遥感 植被指数
在线阅读 下载PDF
基于CNN和Transformer双流融合的人体姿态估计
4
作者 李鑫 张丹 +2 位作者 郭新 汪松 陈恩庆 《计算机工程与应用》 北大核心 2025年第5期187-199,共13页
卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transfor... 卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transformer处理全局信息的优势,构建一种CNN-Transformer双流的并行网络架构来聚合丰富的特征信息。由于传统Transformer的输入需要将图片展平为多个patch,不利于提取对位置敏感的人体结构信息,因此将其多头注意力结构进行改进,使模型输入能够保持原始2D特征图的结构;同时提出特征耦合模块融合两个分支不同分辨率下的特征,最大限度地保留局部特征与全局特征;最后引入改进后的坐标注意力模块(coordinate attention),进一步提升网络的特征提取能力。在COCO和MPII数据集上的实验结果表明所提模型相对目前主流模型具有更高的检测精度,从而说明所提模型能够充分捕获并融合人体姿态中的局部和全局特征。 展开更多
关键词 卷积神经网络 transformER 局部特征 全局特征 2D特征图 特征耦合
在线阅读 下载PDF
多尺度特征提取的Transformer短期风电功率预测 被引量:2
5
作者 徐武 范鑫豪 +1 位作者 沈智方 刘洋 《太阳能学报》 北大核心 2025年第2期640-648,共9页
针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了... 针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了特征提取时维数不被破坏;其次,利用融合自注意力机制的长短期记忆网络挖掘气象条件与功率之间的全局依赖关系;最后,融合风电功率序列本身时序特征和气象条件依赖关系,实现短期风电功率预测。实例仿真结果表明,MTPNet模型预测精度得到提升;消融实验证明了模型各模块的可靠性和有效性,具有一定的实用价值。 展开更多
关键词 风电功率预测 transformER 注意力机制 特征提取 长短期记忆网络 维数不变嵌入层
在线阅读 下载PDF
融合CNN与Transformer的遥感影像道路信息提取
6
作者 曲海成 王莹 +1 位作者 刘腊梅 郝明 《自然资源遥感》 北大核心 2025年第1期38-45,共8页
利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络... 利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络(convolutional neural networks,CNN)和Transformer中,然后,采用了双分支融合模块(shuffle attention dual branch fusion block,SA-DBF)来有效地结合这2个分支学习到的特征,从而实现全局信息与局部信息的融合。其中,双分支融合模块通过细粒度交互对这2个分支的特征进行建模,同时利用多重注意力机制充分提取特征图的通道和空间信息,并抑制掉无效的噪声信息。在公共数据集Massachusetts道路数据集上对模型进行测试,准确率(overall accuracy,OA)、交并比(intersection over union,IoU)和F 1等评价指标分别达到98.04%,88.03%和65.13%;与主流方法U-Net和TransRoadNet等进行比较,IoU分别提升了2.01个百分点和1.42个百分点,实验结果表明所提出的方法优于其他的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 级联神经网络 transformER 特征融合 注意力机制
在线阅读 下载PDF
结合CNN-Transformer特征交互的红外与可见光图像融合方法
7
作者 张德银 张裕尧 +1 位作者 李俊佟 吴章辉 《红外技术》 北大核心 2025年第7期813-822,共10页
针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合... 针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合网络设计了新的空间通道混合注意力机制以提升全局及局部特征的提取效率并得到混合特征块;其次,利用CNN-Transformer的特征交互获取融合混合特征块,并构建多尺度重构网络以实现图像特征重构输出;最后,使用TNO数据集将新融合网络与其它9种融合网络进行对比图像融合实验。实验结果表明,新融合网络获得的融合图像在视觉感知方面表现优异,既突出了红外特征和物体轮廓,又保留了丰富的背景纹理细节;网络在EN、SD、AG、SF、SCD以及VIF指标上相较于现有融合网络平均提高约64.73%、8.17%、69.05%、66.34%、15.39%和25.66%。消融实验证明了新模型的有效性。 展开更多
关键词 CNN-transformer特征交互 全局特征 混合注意力 图像融合 局部特征
在线阅读 下载PDF
基于时序二维变换和多尺度Transformer的电能质量扰动分类方法
8
作者 王守相 李慧强 +3 位作者 赵倩宇 郭陆阳 王同勋 王洋 《电力系统自动化》 北大核心 2025年第7期198-207,共10页
随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利... 随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利用时序二维变换将一维PQD时间序列转换为一组基于多个周期的二维张量,以实现在二维空间中深入挖掘PQD信号中所包含的特征信息。然后,通过多尺度Transformer编码器模块提取PQD信号的多尺度特征图,利用多尺度Transformer解码器模块对多尺度特征图进行拼接和特征融合,有效合并在不同尺度上提取的特征图。最后,通过全连接层和Softmax分类器完成PQD分类任务。为验证所提方法的有效性,建立了含24种PQD的数据集对模型进行测试,结果表明所提方法对PQD信号具有较高的分类准确率和噪声鲁棒性。 展开更多
关键词 电能质量 扰动 分类 时序二维变换 多尺度transformer 特征提取 特征融合
在线阅读 下载PDF
基于双流特征交叉融合Efficient Transformer的人脸表情识别
9
作者 党宏社 孟饶辰 高宛蓉 《计算机工程与应用》 北大核心 2025年第15期251-257,共7页
面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet... 面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet分别提取人脸表情的图像和关键点的多尺度特征,同时采用通道注意力机制来增强关键特征并减少参数量;引入了交叉融合高效多头自注意力机制(cross fusion efficient multi-head self-attention,CFEMSA),对相同尺度的双流特征进行交叉融合,以突出面部显著特征;最后采用特征金字塔结构对不同尺度的交叉融合结果进行多尺度融合,以提高识别的准确性。提出的方法在RAF-DB、AffecNet-7和AffecNet-8数据集上的识别准确率分别为91.82%、67.46%和63.65%,实验结果证明该方法有效缓解了类间相似性和类内差异所引起的识别准确率低的问题。 展开更多
关键词 面部表情识别 Efficient transformer 交叉融合 多尺度特征 特征融合
在线阅读 下载PDF
多维度聚合Transformer的图像超分辨率重建
10
作者 陈清江 陈鹏民 《光学精密工程》 北大核心 2025年第12期1955-1970,共16页
针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。... 针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。其次,设计了空间-通道交互模块,并将其集成于Transformer层中,利用四种形式的注意力机制充分提取关键特征并实现特征融合,从而提升模型性能。最后,提出了特征重用Transformer模块,深入挖掘各层特征之间的关联,精准提取并高效重用重要特征,进一步加强模型表现。实验结果表明,在五个基准测试集上,所提方法优于其他先进算法。在不同放大倍数的超分辨率任务中,相较于基于Swin Transformer的图像恢复方法,峰值信噪比和结构相似度分别平均提升了约0.26 dB和0.0024,且重建效果更加清晰。该方法有效克服了现有方法的不足,在超分辨率任务中展现出显著的性能提升和应用潜力。 展开更多
关键词 图像超分辨率 transformER 注意力机制 特征交互 特征重用 多尺度
在线阅读 下载PDF
基于Transformer两阶段策略的古代服饰线图提取
11
作者 周蓬勃 冯龙 +1 位作者 武浩东 寇宇帆 《西北大学学报(自然科学版)》 北大核心 2025年第1期75-84,共10页
古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第... 古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第一阶段将图像分割成16×16粗粒度补丁,利用编码器进行全局自注意力计算以捕获补丁间依赖;第二阶段采用8×8细粒度无重叠滑动窗口覆盖图像,通过局部编码器计算窗口内注意力有效捕捉细微边缘且降低成本。设计了轻量特征融合模块,支持全局与局部特征的高效整合。实验结果表明,该方法在古代服饰和公共数据集上边缘轮廓信息提取效果优于现有方法,ODS指标平均提升15.9%。虽然OIS和AP未超过Informative Drawing,但在模型体量和耗时方面具有明显优势。 展开更多
关键词 边缘检测 transformER 轻量特征融合模块
在线阅读 下载PDF
基于改进Swin Transformer的人脸活体检测
12
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 Swin transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
基于改进Vision Transformer的水稻叶片病害图像识别
13
作者 朱周华 周怡纳 +1 位作者 侯智杰 田成源 《电子测量技术》 北大核心 2025年第10期153-160,共8页
水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文... 水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文以及局部与全局依赖关系的建模能力,同时降低了对大规模数据集的需求。此外,Vision Transformer中的多层感知器模块被Kolmogorov-Arnold网络结构取代,从而提升了模型对复杂特征的提取能力和可解释性。实验结果表明,所提模型在水稻叶片病害识别任务中取得了优异的性能,识别准确率达到了98.62%,较原始ViT模型提升了6.2%,显著提高了对水稻叶片病害的识别性能。 展开更多
关键词 水稻叶片病害 图像识别 Vision transformer网络 归纳偏置 局部特征
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法
14
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
基于多尺度-多方向Transformer的图像识别 被引量:2
15
作者 杨育婷 李玲玲 +3 位作者 刘旭 焦李成 刘芳 马文萍 《计算机学报》 北大核心 2025年第2期249-265,共17页
有效的特征表示对提升深度学习模型的表征能力和图像识别性能至关重要。例如,多尺度特征表示方法能够捕捉不同尺度的丰富信息,有助于提高深度学习模型的图像识别性能。然而,当前的多尺度深度学习方法仍存在对图像方向特征建模不明确的局... 有效的特征表示对提升深度学习模型的表征能力和图像识别性能至关重要。例如,多尺度特征表示方法能够捕捉不同尺度的丰富信息,有助于提高深度学习模型的图像识别性能。然而,当前的多尺度深度学习方法仍存在对图像方向特征建模不明确的局限,导致对具有方向性目标的误识别。为了更好地表示图像中蕴含的多方向特征,本文提出了一种基于多尺度-多方向Transformer的网络框架(MSMDFormer)。首先,该框架中设计了一种能够捕获并增强多个方向特征的多方向特征编码器。在此基础上,本文联合了不同尺度的Gabor表征与多头注意力机制,设计了一种多尺度多方向Transformer编码器,以有效地聚合图像的多尺度和多方向特征。最后,该框架对卷积特征和多尺度-多方向特征进行融合,然后将融合特征用于图像识别。实验结果表明,MSMDFormer在CIFAR10、CIFAR100和SVHN数据集上分别取得了95.65%、77.46%和96.87%的整体准确率,在与19种基准方法的对比中显示出具有竞争力的图像分类性能。与11种图像分割基准方法相比,MSMDFormer在ADE20K数据集上展现出0.33%至6.58%mIoU的性能增益。综上所述,本文提出的MSMDFormer在深度学习图像识别任务中展现了卓越的特征表示能力,具有广泛的应用前景。另外,探索更有效的方向特征表示方法将成为未来研究的重要方向。 展开更多
关键词 transformER 多尺度 多方向 特征表示 图像识别
在线阅读 下载PDF
基于特征选择与Transformer-LSTM的滚动轴承寿命预测 被引量:2
16
作者 李沁远 雷文平 +2 位作者 闫灏 娄永威 陈阳 《组合机床与自动化加工技术》 北大核心 2025年第2期200-206,211,共8页
滚动轴承作为旋转机械设备中的关键部件,影响着设备的可靠性运行。针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度和不同特征组合对预测模型精度的影响,提出一种基于特征选择与Transformer-LSTM的剩... 滚动轴承作为旋转机械设备中的关键部件,影响着设备的可靠性运行。针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度和不同特征组合对预测模型精度的影响,提出一种基于特征选择与Transformer-LSTM的剩余使用寿命预测模型。首先基于单调性、趋势性以及最大相关最小冗余特征选择算法对振动信号的时域、频域、时频域特征进行重要性排序和筛选,从而捕获特征与剩余寿命以及特征之间的相互的关系。然后将筛选后的特征输入Transformer-LSTM预测模型中,深度挖掘输入特征与RUL之间的复杂映射关系,从而更准确地进行预测。通过公开的轴承数据集进行实验验证,与其他RUL预测方法相比,所提方法的预测性能更优越。 展开更多
关键词 剩余使用寿命 特征选择 最大相关最小冗余 transformer-LSTM模型
在线阅读 下载PDF
基于视觉Transformer的运动特征选择融合微表情识别算法 被引量:1
17
作者 杜含月 张鹏 +3 位作者 林强 李晓桐 徐森 贲晛烨 《信号处理》 北大核心 2025年第2期267-278,共12页
微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,... 微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TVL1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。 展开更多
关键词 微表情识别 特征选择与融合 交叉注意力机制 视觉transformer
在线阅读 下载PDF
基于时空Transformer的视觉目标跟踪算法 被引量:1
18
作者 武晓军 陈怡丹 +2 位作者 冯丽萍 宋长伟 何德清 《传感器与微系统》 北大核心 2025年第3期152-155,共4页
视觉目标跟踪中,由于目标移动速度不同,连续帧对时空邻域的贡献程度也不同。为学习视频帧对邻域信息的贡献,结合自注意力机制学习不同帧的权重大小,提出了一种基于时空Transformer的视觉目标跟踪方法。该算法主要通过关联多帧特征,并在... 视觉目标跟踪中,由于目标移动速度不同,连续帧对时空邻域的贡献程度也不同。为学习视频帧对邻域信息的贡献,结合自注意力机制学习不同帧的权重大小,提出了一种基于时空Transformer的视觉目标跟踪方法。该算法主要通过关联多帧特征,并在时域上进行信息聚合。首先,将图像通过空间Transformer编码器(STE)对空间特征进行编码。然后,通过时空Transformer解码器(STD)模块在时间维度上聚合帧间信息,以捕获时间和空间的全局上下文信息。最后,在LaSOT、GOT—10k等主流数据集进行测评。实验结果表明:算法在精度、成功率及其他评价指标上取得了一定程度的提升。 展开更多
关键词 视觉跟踪 transformER 时空特征 自注意力 特征编码
在线阅读 下载PDF
基于CNN和Efficient Transformer的多尺度遥感图像语义分割算法 被引量:1
19
作者 张振利 胡新凯 +2 位作者 李凡 冯志成 陈智超 《浙江大学学报(工学版)》 北大核心 2025年第4期778-786,共9页
针对现有方法存在遥感图像的多尺度地物特征提取困难和目标边缘分割不准确的问题,提出新的语义分割算法.利用CNN和Efficient Transformer构建双编码器,解耦上下文信息和空间信息.提出特征融合模块加强编码器间的信息交互,有效融合全局... 针对现有方法存在遥感图像的多尺度地物特征提取困难和目标边缘分割不准确的问题,提出新的语义分割算法.利用CNN和Efficient Transformer构建双编码器,解耦上下文信息和空间信息.提出特征融合模块加强编码器间的信息交互,有效融合全局上下文信息和局部细节信息.构建分层Transformer结构提取不同尺度的特征信息,使编码器有效专注不同尺度的物体.提出边缘细化损失函数,缓解遥感图像目标边缘分割不准确的问题.实验结果表明,在ISPRS Vaihingen和ISPRS Potsdam数据集上,所提算法的平均交并比(MIoU)分别为72.45%和82.29%.在SAMRS数据集中的SOTA、SIOR和FAST子集上,所提算法的MIoU分别为88.81%、97.29%和86.65%,总体精度和平均交并比指标均优于对比模型.所提算法在各类不同尺度的目标上有较好的分割性能. 展开更多
关键词 遥感图像 语义分割 双编码器结构 特征融合 Efficient transformer
在线阅读 下载PDF
引入特征融合和Transformer模型预测器的目标跟踪算法
20
作者 龚小梅 张轶 胡术 《计算机工程与应用》 北大核心 2025年第6期254-262,共9页
近年来判别相关滤波器(DCF)在视觉跟踪领域取得了巨大的成功,然而大多数相关滤波跟踪器仅依赖主干网提取的最后一层特征,忽视了低层丰富的目标结构信息。基于此,提出了一种基于特征融合模块和Transformer结构模型预测器的目标跟踪算法... 近年来判别相关滤波器(DCF)在视觉跟踪领域取得了巨大的成功,然而大多数相关滤波跟踪器仅依赖主干网提取的最后一层特征,忽视了低层丰富的目标结构信息。基于此,提出了一种基于特征融合模块和Transformer结构模型预测器的目标跟踪算法。引入了一个金字塔形的特征融合模块,能有效整合低层特征和高层特征。使用采用非对称位置编码方案的Transformer结构预测目标模型权重,以释放模型的表达能力。提出了一个特征优化模块以根据模型权重优化搜索特征。与现有的方法相比,该算法实现了更优的特征表示和更准确的目标定位。在Tracking-Net、LaSOT和UAV123三个主流数据集上的实验结果表明,跟踪器获得了突出性能。 展开更多
关键词 特征融合 transformER 目标跟踪 特征优化 目标分类
在线阅读 下载PDF
上一页 1 2 155 下一页 到第
使用帮助 返回顶部