期刊文献+
共找到3,129篇文章
< 1 2 157 >
每页显示 20 50 100
Spectral matching algorithm based on nonsubsampled contourlet transform and scale-invariant feature transform 被引量:4
1
作者 Dong Liang Pu Yan +2 位作者 Ming Zhu Yizheng Fan Kui Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2012年第3期453-459,共7页
A new spectral matching algorithm is proposed by us- ing nonsubsampled contourlet transform and scale-invariant fea- ture transform. The nonsubsampled contourlet transform is used to decompose an image into a low freq... A new spectral matching algorithm is proposed by us- ing nonsubsampled contourlet transform and scale-invariant fea- ture transform. The nonsubsampled contourlet transform is used to decompose an image into a low frequency image and several high frequency images, and the scale-invariant feature transform is employed to extract feature points from the low frequency im- age. A proximity matrix is constructed for the feature points of two related images. By singular value decomposition of the proximity matrix, a matching matrix (or matching result) reflecting the match- ing degree among feature points is obtained. Experimental results indicate that the proposed algorithm can reduce time complexity and possess a higher accuracy. 展开更多
关键词 point pattern matching nonsubsampled contourlet transform scale-invariant feature transform spectral algorithm.
在线阅读 下载PDF
Digital watermarking algorithm based on scale-invariant feature regions in non-subsampled contourlet transform domain 被引量:8
2
作者 Jian Zhao Na Zhang +1 位作者 Jian Jia Huanwei Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2015年第6期1310-1315,共6页
Contraposing the need of the robust digital watermark for the copyright protection field, a new digital watermarking algorithm in the non-subsampled contourlet transform (NSCT) domain is proposed. The largest energy... Contraposing the need of the robust digital watermark for the copyright protection field, a new digital watermarking algorithm in the non-subsampled contourlet transform (NSCT) domain is proposed. The largest energy sub-band after NSCT is selected to embed watermark. The watermark is embedded into scaleinvariant feature transform (SIFT) regions. During embedding, the initial region is divided into some cirque sub-regions with the same area, and each watermark bit is embedded into one sub-region. Extensive simulation results and comparisons show that the algorithm gets a good trade-off of invisibility, robustness and capacity, thus obtaining good quality of the image while being able to effectively resist common image processing, and geometric and combo attacks, and normalized similarity is almost all reached. 展开更多
关键词 multi-scale geometric analysis (MGA) non-subsampled contourlet transform (NSCT) scale-invariant featureregion.
在线阅读 下载PDF
基于Transformer-FNN和无人机高光谱遥感技术的棉花黄萎病危害等级分类研究 被引量:1
3
作者 廖娟 梁业雄 +7 位作者 姜锐 邢赫 何欣颖 王辉 曾浩求 何松炜 唐赛欧 罗锡文 《农业机械学报》 北大核心 2025年第2期240-251,共12页
针对目前使用无人机识别棉花黄萎病危害等级时,光谱数据冗余度高和传统机器学习模型识别精度不足等问题,采用无人机搭载Nano-Hyperspec高光谱成像仪采集棉田高光谱图像,通过探究棉花冠层对不同黄萎病危害等级的光谱响应特征,利用最优植... 针对目前使用无人机识别棉花黄萎病危害等级时,光谱数据冗余度高和传统机器学习模型识别精度不足等问题,采用无人机搭载Nano-Hyperspec高光谱成像仪采集棉田高光谱图像,通过探究棉花冠层对不同黄萎病危害等级的光谱响应特征,利用最优植被指数组合建立一种适用于黄萎病危害等级分类的监测模型,实现棉花黄萎病危害等级的精准分类。首先,利用最小冗余最大相关算法(Minimum redundancy maximum relevance,mRMR)对17种潜在的植被指数和270个光谱波段进行特征重要性排序,将mRMR筛选得到的特征,通过逐步递增分组的方式输入至极限梯度提升模型(eXtreme gradient boosting,XGBoost),确定与黄萎病危害等级相关性最高的植被指数和光谱特征波段。然后,基于Transformer架构和前馈神经网络(Feedforward neural network,FNN)构建Transformer-FNN棉花黄萎病危害等级分类模型,将植被指数与光谱特征波段输入Transformer-FNN模型进行分类识别,对比了植被指数与光谱特征波段对棉花黄萎病危害等级分类识别的准确性。最后,利用后向传播神经网络(Back propagation neural network,BPNN)、Transformer和支持向量机(Support vector machine,SVM)构建棉花黄萎病危害等级分类模型,并对这4种分类模型进行精度验证与对比分析。结果表明:棉花黄萎病等级分类的最优植被指数组合为MSR和TVI,最优特征波段组合为430、439、488、566、697、722、742、764、769、782、822、831、858、873、878、893、909、985 nm。基于Transformer-FNN模型,植被指数对黄萎病危害等级的总体分类精度为95.6%,较光谱特征波段的总体分类精度89.4%提高6.2个百分点。基于植被指数,Transformer-FNN模型对黄萎病危害等级的分类识别率比BPNN模型提高11.2个百分点,比Transformer模型提高17.2个百分点,比SVM模型提高30.8个百分点。研究提出了一种通过植被指数进行棉花黄萎病高精度监测方法,可为大面积棉花黄萎病精确监测提供有效措施。 展开更多
关键词 棉花黄萎病 transformer-FNN 特征组合 mRMR-XGBoost 高光谱遥感 植被指数
在线阅读 下载PDF
基于时序二维变换和多尺度Transformer的电能质量扰动分类方法 被引量:1
4
作者 王守相 李慧强 +3 位作者 赵倩宇 郭陆阳 王同勋 王洋 《电力系统自动化》 北大核心 2025年第7期198-207,共10页
随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利... 随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利用时序二维变换将一维PQD时间序列转换为一组基于多个周期的二维张量,以实现在二维空间中深入挖掘PQD信号中所包含的特征信息。然后,通过多尺度Transformer编码器模块提取PQD信号的多尺度特征图,利用多尺度Transformer解码器模块对多尺度特征图进行拼接和特征融合,有效合并在不同尺度上提取的特征图。最后,通过全连接层和Softmax分类器完成PQD分类任务。为验证所提方法的有效性,建立了含24种PQD的数据集对模型进行测试,结果表明所提方法对PQD信号具有较高的分类准确率和噪声鲁棒性。 展开更多
关键词 电能质量 扰动 分类 时序二维变换 多尺度transformer 特征提取 特征融合
在线阅读 下载PDF
基于改进Swin Transformer的人脸活体检测 被引量:2
5
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 Swin transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
多尺度特征提取的Transformer短期风电功率预测 被引量:5
6
作者 徐武 范鑫豪 +1 位作者 沈智方 刘洋 《太阳能学报》 北大核心 2025年第2期640-648,共9页
针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了... 针对短期风电功率预测特征提取尺度单一问题,设计一种基于多尺度特征提取的Transformer短期风电功率预测模型(MTPNet)。首先,在Transformer构架的基础上,利用维数不变嵌入,设计多尺度特征提取网络挖掘风电功率序列本身时序特征,保证了特征提取时维数不被破坏;其次,利用融合自注意力机制的长短期记忆网络挖掘气象条件与功率之间的全局依赖关系;最后,融合风电功率序列本身时序特征和气象条件依赖关系,实现短期风电功率预测。实例仿真结果表明,MTPNet模型预测精度得到提升;消融实验证明了模型各模块的可靠性和有效性,具有一定的实用价值。 展开更多
关键词 风电功率预测 transformER 注意力机制 特征提取 长短期记忆网络 维数不变嵌入层
在线阅读 下载PDF
基于CNN和Transformer双流融合的人体姿态估计
7
作者 李鑫 张丹 +2 位作者 郭新 汪松 陈恩庆 《计算机工程与应用》 北大核心 2025年第5期187-199,共13页
卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transfor... 卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transformer处理全局信息的优势,构建一种CNN-Transformer双流的并行网络架构来聚合丰富的特征信息。由于传统Transformer的输入需要将图片展平为多个patch,不利于提取对位置敏感的人体结构信息,因此将其多头注意力结构进行改进,使模型输入能够保持原始2D特征图的结构;同时提出特征耦合模块融合两个分支不同分辨率下的特征,最大限度地保留局部特征与全局特征;最后引入改进后的坐标注意力模块(coordinate attention),进一步提升网络的特征提取能力。在COCO和MPII数据集上的实验结果表明所提模型相对目前主流模型具有更高的检测精度,从而说明所提模型能够充分捕获并融合人体姿态中的局部和全局特征。 展开更多
关键词 卷积神经网络 transformER 局部特征 全局特征 2D特征图 特征耦合
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法 被引量:1
8
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
融合CNN与Transformer的遥感影像道路信息提取
9
作者 曲海成 王莹 +1 位作者 刘腊梅 郝明 《自然资源遥感》 北大核心 2025年第1期38-45,共8页
利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络... 利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络(convolutional neural networks,CNN)和Transformer中,然后,采用了双分支融合模块(shuffle attention dual branch fusion block,SA-DBF)来有效地结合这2个分支学习到的特征,从而实现全局信息与局部信息的融合。其中,双分支融合模块通过细粒度交互对这2个分支的特征进行建模,同时利用多重注意力机制充分提取特征图的通道和空间信息,并抑制掉无效的噪声信息。在公共数据集Massachusetts道路数据集上对模型进行测试,准确率(overall accuracy,OA)、交并比(intersection over union,IoU)和F 1等评价指标分别达到98.04%,88.03%和65.13%;与主流方法U-Net和TransRoadNet等进行比较,IoU分别提升了2.01个百分点和1.42个百分点,实验结果表明所提出的方法优于其他的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 级联神经网络 transformER 特征融合 注意力机制
在线阅读 下载PDF
基于特征提取增强和金字塔结构的实时Transformer小目标检测模型
10
作者 张伟 蔡宇帆 +1 位作者 叶林涛 刘大志 《计算机科学》 北大核心 2025年第S2期363-373,共11页
针对室外环境下小目标检测,如复杂背景、光照不足、目标密集和遮挡严重等挑战,提出了一种基于实时检测Transformer改进的模型LDSD-DETR,用于增强复杂背景下的特征提取及小目标检测能力。为提高特征提取效率,池化层和下采样部分采用线性... 针对室外环境下小目标检测,如复杂背景、光照不足、目标密集和遮挡严重等挑战,提出了一种基于实时检测Transformer改进的模型LDSD-DETR,用于增强复杂背景下的特征提取及小目标检测能力。为提高特征提取效率,池化层和下采样部分采用线性可变形卷积(LDConv)进行改进,能更有效地提取特征,在基于注意力的尺度内特征交互部分引入可变形注意力机制,优化目标相关区域的特征捕捉。针对小目标检测,在跨尺度特征融合部分设计了小目标增强金字塔,增强了对小尺寸目标的敏感度。为了进一步提升性能,重构后的结构结合了DGCST模块,有效捕获图像的局部和全局特征。实验结果表明,LDSD-DETR在Roboflow100及其扩展数据集上的平均检测精度优于其他测试模型,相比原模型,各指标均有效提升,其中mAP50提升至90%,提高了1.8个百分点。此外,模型在计算量、参数量及权重文件大小方面均有所优化,为小目标的实时检测提供了更精确、高效的解决方案。 展开更多
关键词 目标检测 小目标 RT-DETR 特征提取 金字塔结构 transformER
在线阅读 下载PDF
结合CNN-Transformer特征交互的红外与可见光图像融合方法
11
作者 张德银 张裕尧 +1 位作者 李俊佟 吴章辉 《红外技术》 北大核心 2025年第7期813-822,共10页
针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合... 针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合网络设计了新的空间通道混合注意力机制以提升全局及局部特征的提取效率并得到混合特征块;其次,利用CNN-Transformer的特征交互获取融合混合特征块,并构建多尺度重构网络以实现图像特征重构输出;最后,使用TNO数据集将新融合网络与其它9种融合网络进行对比图像融合实验。实验结果表明,新融合网络获得的融合图像在视觉感知方面表现优异,既突出了红外特征和物体轮廓,又保留了丰富的背景纹理细节;网络在EN、SD、AG、SF、SCD以及VIF指标上相较于现有融合网络平均提高约64.73%、8.17%、69.05%、66.34%、15.39%和25.66%。消融实验证明了新模型的有效性。 展开更多
关键词 CNN-transformer特征交互 全局特征 混合注意力 图像融合 局部特征
在线阅读 下载PDF
基于双流特征交叉融合Efficient Transformer的人脸表情识别
12
作者 党宏社 孟饶辰 高宛蓉 《计算机工程与应用》 北大核心 2025年第15期251-257,共7页
面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet... 面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet分别提取人脸表情的图像和关键点的多尺度特征,同时采用通道注意力机制来增强关键特征并减少参数量;引入了交叉融合高效多头自注意力机制(cross fusion efficient multi-head self-attention,CFEMSA),对相同尺度的双流特征进行交叉融合,以突出面部显著特征;最后采用特征金字塔结构对不同尺度的交叉融合结果进行多尺度融合,以提高识别的准确性。提出的方法在RAF-DB、AffecNet-7和AffecNet-8数据集上的识别准确率分别为91.82%、67.46%和63.65%,实验结果证明该方法有效缓解了类间相似性和类内差异所引起的识别准确率低的问题。 展开更多
关键词 面部表情识别 Efficient transformer 交叉融合 多尺度特征 特征融合
在线阅读 下载PDF
多维度聚合Transformer的图像超分辨率重建
13
作者 陈清江 陈鹏民 《光学精密工程》 北大核心 2025年第12期1955-1970,共16页
针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。... 针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。其次,设计了空间-通道交互模块,并将其集成于Transformer层中,利用四种形式的注意力机制充分提取关键特征并实现特征融合,从而提升模型性能。最后,提出了特征重用Transformer模块,深入挖掘各层特征之间的关联,精准提取并高效重用重要特征,进一步加强模型表现。实验结果表明,在五个基准测试集上,所提方法优于其他先进算法。在不同放大倍数的超分辨率任务中,相较于基于Swin Transformer的图像恢复方法,峰值信噪比和结构相似度分别平均提升了约0.26 dB和0.0024,且重建效果更加清晰。该方法有效克服了现有方法的不足,在超分辨率任务中展现出显著的性能提升和应用潜力。 展开更多
关键词 图像超分辨率 transformER 注意力机制 特征交互 特征重用 多尺度
在线阅读 下载PDF
基于Transformer两阶段策略的古代服饰线图提取
14
作者 周蓬勃 冯龙 +1 位作者 武浩东 寇宇帆 《西北大学学报(自然科学版)》 北大核心 2025年第1期75-84,共10页
古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第... 古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第一阶段将图像分割成16×16粗粒度补丁,利用编码器进行全局自注意力计算以捕获补丁间依赖;第二阶段采用8×8细粒度无重叠滑动窗口覆盖图像,通过局部编码器计算窗口内注意力有效捕捉细微边缘且降低成本。设计了轻量特征融合模块,支持全局与局部特征的高效整合。实验结果表明,该方法在古代服饰和公共数据集上边缘轮廓信息提取效果优于现有方法,ODS指标平均提升15.9%。虽然OIS和AP未超过Informative Drawing,但在模型体量和耗时方面具有明显优势。 展开更多
关键词 边缘检测 transformER 轻量特征融合模块
在线阅读 下载PDF
基于多尺度-多方向Transformer的图像识别 被引量:5
15
作者 杨育婷 李玲玲 +3 位作者 刘旭 焦李成 刘芳 马文萍 《计算机学报》 北大核心 2025年第2期249-265,共17页
有效的特征表示对提升深度学习模型的表征能力和图像识别性能至关重要。例如,多尺度特征表示方法能够捕捉不同尺度的丰富信息,有助于提高深度学习模型的图像识别性能。然而,当前的多尺度深度学习方法仍存在对图像方向特征建模不明确的局... 有效的特征表示对提升深度学习模型的表征能力和图像识别性能至关重要。例如,多尺度特征表示方法能够捕捉不同尺度的丰富信息,有助于提高深度学习模型的图像识别性能。然而,当前的多尺度深度学习方法仍存在对图像方向特征建模不明确的局限,导致对具有方向性目标的误识别。为了更好地表示图像中蕴含的多方向特征,本文提出了一种基于多尺度-多方向Transformer的网络框架(MSMDFormer)。首先,该框架中设计了一种能够捕获并增强多个方向特征的多方向特征编码器。在此基础上,本文联合了不同尺度的Gabor表征与多头注意力机制,设计了一种多尺度多方向Transformer编码器,以有效地聚合图像的多尺度和多方向特征。最后,该框架对卷积特征和多尺度-多方向特征进行融合,然后将融合特征用于图像识别。实验结果表明,MSMDFormer在CIFAR10、CIFAR100和SVHN数据集上分别取得了95.65%、77.46%和96.87%的整体准确率,在与19种基准方法的对比中显示出具有竞争力的图像分类性能。与11种图像分割基准方法相比,MSMDFormer在ADE20K数据集上展现出0.33%至6.58%mIoU的性能增益。综上所述,本文提出的MSMDFormer在深度学习图像识别任务中展现了卓越的特征表示能力,具有广泛的应用前景。另外,探索更有效的方向特征表示方法将成为未来研究的重要方向。 展开更多
关键词 transformER 多尺度 多方向 特征表示 图像识别
在线阅读 下载PDF
基于Transformer的逐像素细节补偿去雾网络
16
作者 王燕 刘晶晶 +1 位作者 胡津源 陈燕燕 《计算机工程与科学》 北大核心 2025年第9期1647-1657,共11页
目前,基于深度学习的图像去雾算法难以同时提取图像的全局特征和局部特征,导致复原后的图像细节信息丢失,存在颜色失真现象。针对这一问题,提出一种基于Transformer的逐像素细节补偿去雾网络,主要由基于Transformer的编码器-解码器和CN... 目前,基于深度学习的图像去雾算法难以同时提取图像的全局特征和局部特征,导致复原后的图像细节信息丢失,存在颜色失真现象。针对这一问题,提出一种基于Transformer的逐像素细节补偿去雾网络,主要由基于Transformer的编码器-解码器和CNN分支构成。输入有雾图像,通过编码器进行全局特征提取,编码器中的Transformer由通道自注意力块CAB、压缩注意力块CANB和双分支自适应块DANB组成,其中CANB通过特征聚合、注意力计算和特征恢复捕获图像超像素全局依赖性,DANB采用双分支结构将超像素全局依赖性封装到单个像素中,得到全局特征信息;同时,CNN分支中的空间注意力能够提高网络对不同雾度的感知能力,进行局部特征提取;最后,在解码器部分将编码器和CNN分支提取到的特征进行融合,输出清晰图像。实验结果表明,提出的网络在合成数据集RESIDE和真实数据集O-HAZE与NH-HAZE上均表现突出,能够有效解决细节特征丢失和颜色失真问题。 展开更多
关键词 图像去雾 深度学习 双分支特征融合 细节补偿 transformer架构
在线阅读 下载PDF
基于改进Vision Transformer的水稻叶片病害图像识别
17
作者 朱周华 周怡纳 +1 位作者 侯智杰 田成源 《电子测量技术》 北大核心 2025年第10期153-160,共8页
水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文... 水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文以及局部与全局依赖关系的建模能力,同时降低了对大规模数据集的需求。此外,Vision Transformer中的多层感知器模块被Kolmogorov-Arnold网络结构取代,从而提升了模型对复杂特征的提取能力和可解释性。实验结果表明,所提模型在水稻叶片病害识别任务中取得了优异的性能,识别准确率达到了98.62%,较原始ViT模型提升了6.2%,显著提高了对水稻叶片病害的识别性能。 展开更多
关键词 水稻叶片病害 图像识别 Vision transformer网络 归纳偏置 局部特征
在线阅读 下载PDF
基于双Transformer结构的多模态视频段落描述生成研究
18
作者 赵宏 张立军 《计算机工程与应用》 北大核心 2025年第21期182-191,共10页
针对现有视频段落描述方法对视频中主要事件的关注度不足与多事件描述之间缺乏连贯性的问题,在现有编码器-解码器框架的基础上,提出了一种基于双Transformer结构的多模态视频段落描述模型。采用Faster-RCNN对视频中心帧目标进行细粒度... 针对现有视频段落描述方法对视频中主要事件的关注度不足与多事件描述之间缺乏连贯性的问题,在现有编码器-解码器框架的基础上,提出了一种基于双Transformer结构的多模态视频段落描述模型。采用Faster-RCNN对视频中心帧目标进行细粒度特征提取,由混合注意力结合全局视觉特征选择最具代表性的细粒度局部视觉特征,对视频中主要事件信息进行补充与增强,提高视频内容描述的准确性;提出在Transformer结构中增加存储模块与混合注意力模块,并设计了双Transformer结构,内部Transformer对事件内一致性进行建模,外部Transformer由混合注意力计算与当前事件最相关的状态建模事件间的一致性,结合内外部Transformer的输出对事件内容进行预测,提高生成描述语句的连贯性。在ActivityNet Captions数据集和YouCookII数据集上的实验结果表明,所提模型在BLEU-4、METEOR、ROUGE-L和CIDEr指标上相较于现有主流视频段落描述模型有明显提升,验证了模型的有效性。 展开更多
关键词 视频段落描述 编码器-解码器结构 细粒度局部视觉特征 transformer结构
在线阅读 下载PDF
基于改进时间融合Transformers的中国大豆需求预测方法
19
作者 刘佳佳 秦晓婧 +5 位作者 李乾川 许世卫 赵继春 王一罡 熊露 梁晓贺 《智慧农业(中英文)》 2025年第4期187-199,共13页
[目的/意义]精准预测大豆需求对保障国家粮食安全、优化产业决策与应对国际贸易变局有着重要的现实意义,而利用时间融合Transformers(Temporal Fusion Transformers,TFT)模型开展中国大豆需求预测时,在特征交互层与注意力权重分配等方... [目的/意义]精准预测大豆需求对保障国家粮食安全、优化产业决策与应对国际贸易变局有着重要的现实意义,而利用时间融合Transformers(Temporal Fusion Transformers,TFT)模型开展中国大豆需求预测时,在特征交互层与注意力权重分配等方面仍存在一定局限。为此,亟需探索一种基于改进TFT模型的预测方法,以提升需求预测的准确性与可解释性。[方法]本研究将深度学习的TFT模型应用到中国大豆需求预测中,提出了一种基于多层动态特征交互(Multi-layer Dynamic Feature Interaction,MDFI)与自适应注意力权重优化(Adaptive Attention Weight Optimization,AAWO)改进的MA-TFT(Improved TFT Model Based on MDFI and AAWO)模型。对包含1980—2024年4652个相关指标的中国大豆需求分析数据集进行数据预处理和特征工程,设计实验将MA-TFT模型分别与自回归差分移动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)、长短期记忆网络(Long Short-Term Memory,LSTM)模型及TFT模型进行预测性能对比,进行了消融实验,同时利用SHAP(SHapley Additive exPlanations)工具可解释性分析影响中国大豆需求的关键特征变量,开展了未来10年的中国大豆需求量预测。[结果和讨论]MA-TFT模型的均方误差(Mean Squared Error,MSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)分别为0.036和5.89%,决定系数R^(2)为0.91,均高于对比模型,均方根误差(Root Mean Square Error,RMSE)和MAPE分别较基准模型TFT累计降低21.84%和3.44%,表明改进TFT的MA-TFT模型能够捕捉特征间复杂关系,提升预测性能;研究利用SHAP工具可解释性分析发现,MA-TFT模型对影响中国大豆需求关键特征变量的解释稳定性较高;预计2025、2030和2034年中国大豆需求量分别达到11799万吨、11033万吨和11378万吨。[结论]基于改进TFT的MA-TFT模型方法为解决现有大豆需求预测方法精度不足、可解释性不强的实际问题提供了解决思路,也为其他农产品时间序列预测的方法优化与应用提供了参考和借鉴。 展开更多
关键词 时间融合transformers(TFT) 大豆需求预测 多层动态特征交互 自适应注意力权重优化 可解释性分析
在线阅读 下载PDF
增强双流Transformer的柴油发动机剩余寿命预测模型 被引量:1
20
作者 张曦 杨颖 +2 位作者 陈超君 王春风 杨磊 《汽车工程》 北大核心 2025年第2期292-300,325,共10页
基于Transformer的模型在剩余使用寿命(remaining useful life,RUL)预测方面取得了显著的进展。然而,现有Transformer模型主要存在以下不足:模型在提取局部特征方面有所欠缺,且没有同时考虑输入特征的不同时间和不同空间的重要性。针对... 基于Transformer的模型在剩余使用寿命(remaining useful life,RUL)预测方面取得了显著的进展。然而,现有Transformer模型主要存在以下不足:模型在提取局部特征方面有所欠缺,且没有同时考虑输入特征的不同时间和不同空间的重要性。针对以上问题,提出一种增强的双流Transformer模型,通过局部特征提取模块和交互融合模块对模型进行增强。首先,通过局部特征提取模块分别在时间流和空间流提取局部特征,以弥补Transformer在局部特征提取方面的不足。然后,使用双流Transformer分别在时间和空间维度提取长期依赖,增强双流分支的互补学习。最后,构建交互融合模块,通过双线性融合方法捕获流级交互,进一步提升预测效果。使用多个模型在某柴油发动机制造商两个真实的数据集上进行实验,其结果表明评价指标RMSE和Score至少分别降低3.23%和5.89%。 展开更多
关键词 剩余使用寿命预测 transformer编码器 卷积神经网络 特征融合 滑动窗口
在线阅读 下载PDF
上一页 1 2 157 下一页 到第
使用帮助 返回顶部