期刊文献+
共找到637篇文章
< 1 2 32 >
每页显示 20 50 100
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
1
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 transformer 注意力模块 梯度融合
在线阅读 下载PDF
EFormer:基于分频和广注意力的高效Transformer医学图像配准模型
2
作者 黄星宇 王丽会 +3 位作者 唐堃 程欣宇 张健 叶晨 《计算机科学》 北大核心 2025年第7期151-160,共10页
医学图像配准对于多种后处理步骤至关重要。目前基于卷积和Transformer的单流或双流网络架构能够实现良好的配准性能,但在配准性能与计算效率之间仍然难以取得平衡。为了解决这个问题,提出了一种高效的Transformer配准网络EFormer。其... 医学图像配准对于多种后处理步骤至关重要。目前基于卷积和Transformer的单流或双流网络架构能够实现良好的配准性能,但在配准性能与计算效率之间仍然难以取得平衡。为了解决这个问题,提出了一种高效的Transformer配准网络EFormer。其主要由分频器模块(Frequency Division Module, FDM)和广注意力模块(Broad Attention Module, BAM)组成。具体而言,在编解码器中使用多个FDM模拟双流网络并行提取局部-全局信息以提高计算效率;利用BAM增强多个FDM中局部信息的传递以保留配准中重要的语义特征。在3个数据集上的定性和定量比较实验结果表明,相比主流配准模型,EFormer在DSC,ASSD,HD95和雅可比行列式负值百分比4个评价指标上分别至少优化了1.3%,2.6%,0.6%和95%。此外,使用EFormer-tiny时,计算效率(Flops)优化了14%,表明EFormer能够以最快的计算速度在基于Transformer的网络中实现最佳的配准结果。 展开更多
关键词 医学图像配准 分频 广注意力 高效transformer
在线阅读 下载PDF
融合注意力与Transformer的肝肿瘤CT图像分割方法
3
作者 张倩 胡建文 +1 位作者 王鼎湘 李茂军 《小型微型计算机系统》 北大核心 2025年第3期680-688,共9页
CT图像是医生对病人进行疾病诊断和制定治疗计划的重要依据.然而,CT图像中肝肿瘤通常具有灰度多样、边界模糊、且与肝脏正常组织细胞的密度很接近等特点,导致肿瘤的边缘区域的分割和上下文特征信息的获取受到了限制.本文提出了一种融合... CT图像是医生对病人进行疾病诊断和制定治疗计划的重要依据.然而,CT图像中肝肿瘤通常具有灰度多样、边界模糊、且与肝脏正常组织细胞的密度很接近等特点,导致肿瘤的边缘区域的分割和上下文特征信息的获取受到了限制.本文提出了一种融合注意力机制与Transformer的U型分割网络(Integrated the Attention mechanism and Transformer U-shaped segmentation network,IAT-Unet).首先,在编码器的末端级联BiFormer模块,对富含语义信息的高级特征进行全局建模,避免造成关键信息的丢失;其次,在解码器中引入双重高效注意力机制(Dual highly Effective Attention Mechanism,DEAM),在空间上建模和跨通道交互,可以捕获肿瘤准确的定位信息和远程依赖关系,提高肿瘤特征的表达能力;此外,提出双桥跳跃连接,通过在编码器与解码器直接连接和利用边缘增强模块(Edge Enhancement Module,EEM)进行间接连接,可以补偿编码器在提取特征时丢失的信息,同时也能突出肿瘤的边缘轮廓.所提出的方法在公开数据集LiTS17进行验证表明,该方法的Dice系数、Jaccard相似系数、精确率和召回率分别为93.32%、87.47%、93.09%和93.55%;在3DIRCADb数据集上验证,肝肿瘤分割的Dice系数为90.40%.与多种分割方法进行比较,该方法对CT图像中肝肿瘤的分割具有优势. 展开更多
关键词 医学图像分割 肝肿瘤分割 U-net transformer 注意力机制
在线阅读 下载PDF
一种并行注意力的金字塔视觉Transformer的结肠息肉分割网络
4
作者 庞飞翔 丁德锐 罗康 《小型微型计算机系统》 北大核心 2025年第5期1161-1168,共8页
针对结肠息肉数据的多样性特征以及大多数息肉分割的方法缺乏将不同层的特征信息进行交互的不足,本文提出了一种新的结肠息肉分割模型(PVT-PMFFD).该模型由可以捕捉多尺度信息的金字塔视觉Tranformer(PVT)编码器和实现不同层之间多尺度... 针对结肠息肉数据的多样性特征以及大多数息肉分割的方法缺乏将不同层的特征信息进行交互的不足,本文提出了一种新的结肠息肉分割模型(PVT-PMFFD).该模型由可以捕捉多尺度信息的金字塔视觉Tranformer(PVT)编码器和实现不同层之间多尺度信息交互的并行多级特征融合解码器(PMFFD)组成.特别地,并行多级特征融合解码器包括了特征融合池化模块(FPM)用于全局和局部信息的融合,特征增强模块(FEM)用于对特征信息的增强,并行注意力卷积模块(PACM)用于实现全局和局部信息之间的交互以及细化再增强特征.此外本文使用了深度监督的框架,对多级特征进行监督学习,进一步改善了模型的分割性能.本文模型在5个息肉数据集上与9个医学图像分割网络进行对比,结果表明本文方法具有更强的学习能力与泛化能力. 展开更多
关键词 结肠息肉分割 金字塔视觉transformer 并行多级特征融合 注意力
在线阅读 下载PDF
融合快速边缘注意力的Transformer跟踪算法
5
作者 薛紫涵 葛海波 +2 位作者 王淑贤 安玉 杨雨迪 《计算机工程与应用》 北大核心 2025年第1期221-231,共11页
针对长期目标跟踪中出现模型退化和跟踪漂移的问题,提出了一种融合快速边缘注意力的Transformer跟踪算法TransFEA(fast edge attention on Transformer)。使用ResNet-50作为Siamese网络的骨干网络,并在其每个残差块后端引入注意力网络... 针对长期目标跟踪中出现模型退化和跟踪漂移的问题,提出了一种融合快速边缘注意力的Transformer跟踪算法TransFEA(fast edge attention on Transformer)。使用ResNet-50作为Siamese网络的骨干网络,并在其每个残差块后端引入注意力网络进行特征提取,增强目标的关键信息和全局信息;边缘注意力网络(edge attention network,EA)提取模板与搜索区域的特征向量,快速注意力网络(fast attention network,FA)计算注意响应值,确定两个区域的相似度,以此调整目标位置。设计多层感知器预测边界框,避免过多超参数,使跟踪器实现了准确性与轻量化的平衡。实验结果表明,TransFEA在LaSOT数据集上成功率和准确率分别为65.3%、69.1%,运行可以达到90 FPS,提高了长期跟踪的成功率和准确率。 展开更多
关键词 transformer网络 边缘注意力网络 快速注意力网络 多层感知器
在线阅读 下载PDF
基于CNN-Transformer和注意力金字塔的行人重识别方法研究
6
作者 徐岩 刘香兰 +2 位作者 潘旭光 李芳 赵海燕 《山东科技大学学报(自然科学版)》 北大核心 2025年第1期110-118,共9页
针对行人重识别技术中难以捕捉不同尺度特征图的显著区域,以及在非重叠摄像机中将多尺度特征汇总到全局视图中仍存在挑战的问题,提出一种基于CNN-Transformer和注意力金字塔的行人重识别方法。首先,引入基于Transformer的特征校准模块... 针对行人重识别技术中难以捕捉不同尺度特征图的显著区域,以及在非重叠摄像机中将多尺度特征汇总到全局视图中仍存在挑战的问题,提出一种基于CNN-Transformer和注意力金字塔的行人重识别方法。首先,引入基于Transformer的特征校准模块和深度监督聚合方法组成TFCNet,从全局角度以循环自适应的方式将骨干网络的各层级不同尺度的特征进行聚合。然后,设计一种串行融合注意力模块,在计算时能够结合通道和空间的信息交互。同时,引入注意力金字塔,设计一种多尺度串行融合注意力金字塔结构,采用由粗到细的金字塔方法学习到更多不同尺度特征图的显著区域,提取更多有识别性的行人特征。最后,采用多重损失函数对网络进行总体优化,并在三个主流数据集上进行实验验证,证明了所提方法的有效性。 展开更多
关键词 行人重识别 transformer 特征聚合 注意力金字塔
在线阅读 下载PDF
Transformer结构与注意力机制融合的无人机图像小目标识别方法
7
作者 王国帅 黄贻望 +2 位作者 刘建晓 毛志 刘声 《南京大学学报(自然科学版)》 北大核心 2025年第2期214-222,共9页
目前无人机(Unmanned Aerial Vehicle,UAV)航拍图像中存在较多密集和尺寸较小的实例,识别效果往往较差.针对此问题,在YOLOv5的骨干网络中使用带有Transformer结构的C3TR模块替换原有的C3(CSP Bottleneck with 3 Convolutions)模块来增... 目前无人机(Unmanned Aerial Vehicle,UAV)航拍图像中存在较多密集和尺寸较小的实例,识别效果往往较差.针对此问题,在YOLOv5的骨干网络中使用带有Transformer结构的C3TR模块替换原有的C3(CSP Bottleneck with 3 Convolutions)模块来增强骨干网络的特征提取能力,之后,在SPPF层后加入CA(Coordinate Attention)模块来增强模型对小目标区域的关注度.其次,在颈部网络中使用ConvNeXtBlock模块替换C3模块,ConvNeXtBlock的深层卷积能够进一步增强对小目标细节的识别,提高目标检测的准确性.最后,使用ECIoU损失函数替换CIoU损失函数来进一步提升模型的收敛速度和精度.实验结果表明,在VisDrone2019公开数据集上,与基线模型YOLOv5l相比,改进模型的mAP_(0.5)和mAP_(0.5∶0.95)分别提升9.5%和6.3%,和其他模型相比也有比较好的效果. 展开更多
关键词 无人机 YOLOv5 小目标 transformer 注意力机制
在线阅读 下载PDF
基于Transformer模型与注意力机制的差分密码分析
8
作者 肖超恩 李子凡 +2 位作者 张磊 王建新 钱思源 《计算机工程》 北大核心 2025年第1期156-163,共8页
基于差分分析的密码攻击中,通常使用贝叶斯优化方法验证部分解密的数据是否具有差分特性。目前,主要采用基于深度学习的方式训练1个差分区分器,但随着加密轮数的增加,差分特征的精确度会呈现线性降低的趋势。为此,结合注意力机制和侧信... 基于差分分析的密码攻击中,通常使用贝叶斯优化方法验证部分解密的数据是否具有差分特性。目前,主要采用基于深度学习的方式训练1个差分区分器,但随着加密轮数的增加,差分特征的精确度会呈现线性降低的趋势。为此,结合注意力机制和侧信道分析,提出了一种新的差分特性判别方法。根据多轮密文间的差分关系,基于Transformer训练了1个针对SPECK32/64算法的差分区分器。在密钥恢复攻击中,借助前一轮的密文对待区分密文影响最大特性,设计了新的密钥恢复攻击方案。在SPECK32/64算法的密钥恢复攻击中,采用26个选择明密文对,并借助第20轮密文对将第22轮65536个候选密钥范围缩小至17个以内,完成对最后两轮子密钥的恢复攻击。实验结果表明,该方法的攻击成功率达90%,可以有效应对加密轮数增多造成的密文差分特征难以识别的问题。 展开更多
关键词 transformer模型 注意力机制 差分区分器 SPECK32/64算法 密钥恢复攻击
在线阅读 下载PDF
融合Transformer和注意力的轻量高效人体姿态估计 被引量:1
9
作者 吴程鹏 谭光兴 +1 位作者 陈海峰 李春宇 《计算机工程与应用》 CSCD 北大核心 2024年第22期197-208,共12页
针对人体姿态估计算法的沉重计算成本和庞大网络规模问题,提出面向人体姿态估计的轻量级高效视觉变换器(lightweight efficient vision transformer for human posture estimation,LEViTPose)。引入深度可分离卷积、通道混洗和多尺度卷... 针对人体姿态估计算法的沉重计算成本和庞大网络规模问题,提出面向人体姿态估计的轻量级高效视觉变换器(lightweight efficient vision transformer for human posture estimation,LEViTPose)。引入深度可分离卷积、通道混洗和多尺度卷积核并行技术来设计轻量级预处理模块LStem;提出一种级联组空间线性退化注意力(cascaded group spatial linear reduction attention,CGSLRA),采用特征分组划分多个注意头的方式来提升内存存储效率,采用组内特征降维来降低计算冗余;通过引入逐点卷积和分组反卷积来设计轻量级特征还原模块(lightweight feature recovery module,LFRM)。实验结果表明,所提方法相比基线模型,可以在提升网络性能和推理速度的同时降低网络规模和计算开销。在MPII和COCO验证集上与LiteHRNet-30相比,平均准确率分别提高了2.6和3.4个百分点,推理速度提升了1倍。 展开更多
关键词 人体姿态估计 轻量级网络 注意力机制 transformer
在线阅读 下载PDF
小数据集上基于语义的局部注意视觉Transformer方法
10
作者 冯欣 王俊杰 +1 位作者 钟声 方婷婷 《计算机应用研究》 北大核心 2025年第1期314-320,共7页
在小数据集上从零开始训练时,视觉Transformer无法与同规模的卷积神经网络媲美。基于图像的局部注意力方法,可以显著提高ViT的数据效率,但是会丢失距离较远但相关的补丁之间的信息。为了解决上述问题,提出一种双向并行局部注意力视觉Tra... 在小数据集上从零开始训练时,视觉Transformer无法与同规模的卷积神经网络媲美。基于图像的局部注意力方法,可以显著提高ViT的数据效率,但是会丢失距离较远但相关的补丁之间的信息。为了解决上述问题,提出一种双向并行局部注意力视觉Transformer的方法。该方法首先在特征层面上对补丁进行分组,在组内执行局部注意力,以利用特征空间中补丁之间的关系弥补信息丢失。其次,为了有效融合补丁之间的信息,将基于语义的局部注意力和基于图像的局部注意力并行结合起来,通过双向自适应学习来增强ViT模型在小数据上的性能。实验结果表明,该方法在计算量为15.2 GFLOPs和参数量为57.2 M的情况下,分别在CIFAR-10和CIFAR-100数据集上实现了97.93%和85.80%的准确性。相比于其他方法,双向并行局部注意力视觉Transformer在增强局部引导能力的同时,保持了局部注意力所需属性的有效性。 展开更多
关键词 深度学习 图像分类 transformer 局部注意力 基于语义的局部注意
在线阅读 下载PDF
Transformer-CNN特征跨注意力融合学习的行人重识别 被引量:3
11
作者 项俊 张金城 +1 位作者 江小平 侯建华 《计算机工程与应用》 CSCD 北大核心 2024年第16期94-104,共11页
卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特... 卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特点,在丰富行人局部特征的同时改善特征的全局表达能力。该模型由三个部分构成:CNN分支主要提取局部细节信息;Transformer分支侧重于关注全局特征信息;跨注意力融合分支通过自注意力机制计算上述两个分支特征的相关性,进而实现特征融合,最终提高模型的表征能力。剥离实验以及在Market1501和DukeMTMC-reID数据集的实验结果证明了所提方法的有效性。 展开更多
关键词 行人重识别 卷积神经网络(CNN) transformer 注意力融合学习
在线阅读 下载PDF
空间可分离注意力的跨尺度编码Transformer遥感图像道路提取方法 被引量:1
12
作者 田青 张瑶 +1 位作者 张正 吕其修 《计算机工程与应用》 CSCD 北大核心 2024年第23期219-228,共10页
遥感图像的道路分割任务是遥感应用领域的一个研究热点,一直受到广泛的关注。由于遥感图像天然具备背景复杂、目标密集等特性,全局语义信息的构建对于准确提取遥感图像中道路是至关重要的。因此,基于Transformer模型进行优化,提出了基... 遥感图像的道路分割任务是遥感应用领域的一个研究热点,一直受到广泛的关注。由于遥感图像天然具备背景复杂、目标密集等特性,全局语义信息的构建对于准确提取遥感图像中道路是至关重要的。因此,基于Transformer模型进行优化,提出了基于空间可分离注意力的跨尺度令牌嵌入Transformer遥感道路提取模型Cross-RoadFormer。具体而言,针对图像中道路尺度不统一的问题,设计了跨尺度编码层,将不同尺度的特征编码作为一个令牌嵌入整体,作为Transformer的输入,解决了Transformer跨尺度交互的问题;此外,提出了一种空间可分离注意力,其中,局部分组注意力获取细粒度、短距离信息,全局采样注意力捕获长距离、全局上下文信息,在保证道路提取准确度的前提下,降低了模型的计算量。在Massachusetts数据集和DeepGlobe数据集上的实验表明,提出的Cross-RoadFormer都实现了更高的IoU(intersection over union),分别为68.40%和58.04%,展现了该方法的优越性。 展开更多
关键词 道路提取 遥感图像 transformer 注意力机制
在线阅读 下载PDF
融合卷积注意力和Transformer架构的行人重识别方法 被引量:2
13
作者 王静 李沛橦 +2 位作者 赵容锋 张云 马振玲 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期466-476,共11页
行人重识别技术是智能安防系统中的重要方法之一,为构建一个适用各种复杂场景的行人重识别模型,基于现有的卷积神经网络和Transformer模型,提出一种融合卷积注意力和Transformer(FCAT)架构的方法,以增强Transformer对局部细节信息的关... 行人重识别技术是智能安防系统中的重要方法之一,为构建一个适用各种复杂场景的行人重识别模型,基于现有的卷积神经网络和Transformer模型,提出一种融合卷积注意力和Transformer(FCAT)架构的方法,以增强Transformer对局部细节信息的关注。所提方法主要将卷积空间注意力和通道注意力嵌入Transformer架构中,分别加强对图像中重要区域的关注和对重要通道特征的关注,以进一步提高Transformer架构对局部细节特征的提取能力。在3个公开行人重识别数据集上的对比消融实验证明,所提方法在非遮挡数据集上取得了与现有方法相当的结果,在遮挡数据集上的性能得到显著提升。所提方法更加轻量化,在不增加额外计算量和模型参数的情况下,推理速度得到了提升。 展开更多
关键词 行人重识别 深度学习 卷积神经网络 transformer 注意力机制
在线阅读 下载PDF
结合极化自注意力和Transformer的结直肠息肉分割方法 被引量:1
14
作者 谢斌 刘阳倩 李俞霖 《光电工程》 CAS CSCD 北大核心 2024年第10期87-101,共15页
针对传统结直肠息肉图像分割方法存在的目标分割不够精确、对比度不足,以及边缘细节模糊等问题,文中结合极化自注意力和Transformer提出了一种新的结直肠息肉图像分割方法。首先,设计了一种改进的相位感知混合模块,通过动态捕捉Transfor... 针对传统结直肠息肉图像分割方法存在的目标分割不够精确、对比度不足,以及边缘细节模糊等问题,文中结合极化自注意力和Transformer提出了一种新的结直肠息肉图像分割方法。首先,设计了一种改进的相位感知混合模块,通过动态捕捉Transformer结直肠息肉图像的多尺度上下文信息,以使目标分割更加精确。其次,在新方法中引入了极化自注意力机制,实现了图像的自我注意力强化,使得到的图像特征可以直接用于息肉分割任务中,以达到提高病灶区域与正常组织区域对比度的目的。另外,利用线索交叉融合模块加强动态分割时对图像几何结构的捕捉能力,以达到提升结果图像边缘细节的目的。实验结果表明,文中提出的方法不仅能够有效地提升结直肠息肉分割的精确度和对比度,并且还能够较好地克服分割图像细节模糊的问题。在数据集CVC-ClinicDB、Kvasir、CVC-ColonDB和ETIS-LaribPolypDB上的测试结果表明,文中所提新方法能够取得更好的分割效果,其Dice相似性指数分别为0.946、0.927、0.805和0.781。 展开更多
关键词 结直肠息肉 transformer 相位感知模块 极化自注意力模块
在线阅读 下载PDF
基于窗口注意力聚合Swin Transformer的无人机影像语义分割方法 被引量:1
15
作者 李俊杰 易诗 +1 位作者 何润华 刘茜 《计算机工程与应用》 CSCD 北大核心 2024年第15期198-210,共13页
采用无人机遥感影像进行地物分类的过程中,由于无人机影像的小尺寸地物目标不够突出和无人机影像背景复杂、地物信息难以辨别等问题,采用现行的经典语义分割方法难以获得理想的地物分类效果。该研究以Swin Transformer网络模型为基础,... 采用无人机遥感影像进行地物分类的过程中,由于无人机影像的小尺寸地物目标不够突出和无人机影像背景复杂、地物信息难以辨别等问题,采用现行的经典语义分割方法难以获得理想的地物分类效果。该研究以Swin Transformer网络模型为基础,提出了基于窗口注意力聚合Swin Transformer(window attention aggregation Swin Transformer,WAA SwinT)的语义分割网络模型方法。采用了多窗口注意力聚合的方式来进行更精准的注意力计算,以提升无人机遥感影像中的小尺寸地物目标的分类精度和质量。同时借鉴嵌入连接的思想,采用多级特征嵌入连接解码器改善网络结构,应用于无人机遥感影像的分割中,取得了更精细化的分割效果。为了验证提出的方法在无人机影像语义分割中的效果,分别在城市无人机遥感影像UAVid数据集和UDD数据集进行了实验,并与现行的经典语义分割方法进行了对比。实验结果表明,语义分割方法在UAVid数据集和UDD数据集上均可以得到最佳的语义分割效果。同时,该语义分割方法能显著地提升无人机影像中小尺寸地物精准分割的质量。 展开更多
关键词 无人机影像 语义分割 Swin transformer 窗口注意力聚合
在线阅读 下载PDF
基于轻量化Transformer的高效图像超分辨率算法研究
16
作者 高翔 王凡 胡小鹏 《大连理工大学学报》 北大核心 2025年第2期212-220,共9页
基于Transformer的算法在图像超分辨率领域取得的重要性能突破,得益于其捕捉图像中长程依赖关系的强大能力.然而,繁重的计算成本和高GPU显存消耗限制了其在实际中的应用,于是提出了一种基于轻量化Transformer的高效图像超分辨率算法——... 基于Transformer的算法在图像超分辨率领域取得的重要性能突破,得益于其捕捉图像中长程依赖关系的强大能力.然而,繁重的计算成本和高GPU显存消耗限制了其在实际中的应用,于是提出了一种基于轻量化Transformer的高效图像超分辨率算法——LISRFormer.该算法引入轻量化Transformer,在捕捉长程依赖关系的同时将复杂度从现有的二次方降为线性.通过跨通道计算交叉协方差,得到可应用于大尺寸图像的转置注意力图.层归一化仅作用于查询和键分支,以保留重要的输入特征.此外,还设计了一种高效门控深度卷积前馈网络(EGDFN),作为Transformer中的前馈网络,进一步恢复准确的纹理信息.在基准数据集上进行的大量定量和定性实验表明,该算法在计算成本和图像重建质量方面优于现有轻量化图像超分辨率算法. 展开更多
关键词 图像超分辨率 transformer 轻量化 注意力
在线阅读 下载PDF
结合沙漏注意力与渐进式混合Transformer的图像分类方法
17
作者 彭晏飞 崔芸 +1 位作者 陈坤 李泳欣 《液晶与显示》 CAS CSCD 北大核心 2024年第9期1223-1232,共10页
Transformer在图像分类任务中具有广泛应用,但在小数据集分类任务中,Transformer受到数据量较少、模型参数量过大等因素的影响,导致分类精度低、收敛速度缓慢。本文提出了一种融合沙漏注意力的渐进式混合Transformer模型。首先,通过下-... Transformer在图像分类任务中具有广泛应用,但在小数据集分类任务中,Transformer受到数据量较少、模型参数量过大等因素的影响,导致分类精度低、收敛速度缓慢。本文提出了一种融合沙漏注意力的渐进式混合Transformer模型。首先,通过下-上采样的沙漏自注意力建模全局特征关系,利用上采样补充下采样操作丢失的信息,同时采用可学习温度参数和负对角掩码锐化注意力的分数分布,避免因层数过多产生过度平滑的现象;其次,设计渐进式下采样模块获得细粒度多尺度特征图,有效捕获低维特征信息;最后,使用混合架构,在顶层阶段使用设计的沙漏注意力,底层阶段使用池化层替代注意力模块,并引入带有深度卷积的层归一化,增加网络局部性。所提方法在T-ImageNet、CIFAR10、CIFAR100、SVHN数据集上进行实验,分类精度可以达到97.42%,计算量和参数量分别为3.41G和25M。实验结果表明,与对比算法相比,该方法的分类精度有明显提升,计算量和参数量有明显降低,提高了Transformer模型在小数据集上的性能表现。 展开更多
关键词 小数据集图像分类 transformer 沙漏注意力 多尺度特征 混合架构
在线阅读 下载PDF
融合Transformer和交互注意力网络的方面级情感分类模型
18
作者 程艳 胡建生 +5 位作者 赵松华 罗品 邹海锋 詹勇鑫 富雁 刘春雷 《智能系统学报》 CSCD 北大核心 2024年第3期728-737,共10页
现有的大多数研究者使用循环神经网络与注意力机制相结合的方法进行方面级情感分类任务。然而,循环神经网络不能并行计算,并且模型在训练过程中会出现截断的反向传播、梯度消失和梯度爆炸等问题,传统的注意力机制可能会给句子中重要情... 现有的大多数研究者使用循环神经网络与注意力机制相结合的方法进行方面级情感分类任务。然而,循环神经网络不能并行计算,并且模型在训练过程中会出现截断的反向传播、梯度消失和梯度爆炸等问题,传统的注意力机制可能会给句子中重要情感词分配较低的注意力权重。针对上述问题,该文提出了一种融合Transformer和交互注意力网络的方面级情感分类模型。首先利用BERT(bidirectional encoder representation from Transformers)预训练模型来构造词嵌入向量,然后使用Transformer编码器对输入的句子进行并行编码,接着使用上下文动态掩码和上下文动态权重机制来关注与特定方面词有重要语义关系的局部上下文信息。最后在5个英文数据集和4个中文评论数据集上的实验结果表明,该文所提模型在准确率和F1上均表现最优。 展开更多
关键词 方面词 情感分类 循环神经网络 transformer 交互注意力网络 BERT 局部特征 深度学习
在线阅读 下载PDF
YOLO-BFEPS:一种高效注意力增强的跨尺度YOLOv10火灾检测模型
19
作者 高均益 张伟 李泽麟 《计算机科学》 北大核心 2025年第S1期412-420,共9页
为解决传统火灾检测模型在处理复杂场景时,特征提取不充分和模型复杂度过高导致预警延迟及识别精度下降的问题,提出一种可部署到终端设备上的基于改进YOLOv10的新型火灾检测模型YOLO-BFEPS(YOLO Bi-directional Fusion with Enhanced Pa... 为解决传统火灾检测模型在处理复杂场景时,特征提取不充分和模型复杂度过高导致预警延迟及识别精度下降的问题,提出一种可部署到终端设备上的基于改进YOLOv10的新型火灾检测模型YOLO-BFEPS(YOLO Bi-directional Fusion with Enhanced Partial Self-Attention),实现了同时对烟雾与火灾的快速准确检测。首先,改进PSA模块,加强空间语义特征提取,解决通道降维建模跨通道关系时带来的信息丢失与计算复杂度增加的问题,提高检测精度,并将改进后的模块记为E-PSA(Enhanced Partial Self-Attention);其次,基于BiFPN提出特征层双向跨连接的思想进行尺度融合,重新设计了YOLOv10的颈部结构,并创新性地增加来自低特征层信息的融合,在保持准确度的同时大大减少了模型参数以及计算复杂度;引入Faster Block结构替换C2f模块的Bottleneck结构,实现模型的轻量化设计,并将其称为C2f-Faster。最后,通过在多个数据集上进行实验验证了所提模型的有效性,其在参数量减少35.5%、计算复杂度降低17.6%的基础上,将检测精度(Precision)和mAP@0.5分别提升了5.9%和1.4%。 展开更多
关键词 高效注意力 多尺度特征 加权双向特征金字塔 火灾检测 YOLOv10 轻量化 计算机视觉 深度学习
在线阅读 下载PDF
基于TF-IDF和多头注意力Transformer模型的文本情感分析 被引量:14
20
作者 高佳希 黄海燕 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期129-136,共8页
文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Documen... 文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency)和多头注意力Transformer模型的文本情感分析模型。在文本预处理阶段,利用TF-IDF算法对影响文本情感倾向较大的词语进行初步筛选,舍去常见的停用词及其他文本所属邻域对文本情感倾向影响较小的专有名词。然后,利用多头注意力Transformer模型编码器进行特征提取,抓取文本内部重要的语义信息,提高模型对语义的分析和泛化能力。该模型在多领域、多类型评论语料库数据集上取得了98.17%的准确率。 展开更多
关键词 文本情感分析 自然语言处理 多头注意力机制 TF-IDF算法 transformer模型
在线阅读 下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部