期刊文献+
共找到1,241篇文章
< 1 2 63 >
每页显示 20 50 100
基于注意力机制的特征融合推荐模型 被引量:1
1
作者 马汉达 李腾飞 《计算机工程与科学》 北大核心 2025年第5期902-911,共10页
针对目前推荐系统难以获得特征信息,缺乏有效的方法来表示特征信息的权重的问题,提出了一种基于注意力机制与特征融合的推荐模型FFADeepCF_SPS。首先,针对特征表示不够充分的问题,使用因子分解机融合特征,将特征从一维扩展到高维,从而... 针对目前推荐系统难以获得特征信息,缺乏有效的方法来表示特征信息的权重的问题,提出了一种基于注意力机制与特征融合的推荐模型FFADeepCF_SPS。首先,针对特征表示不够充分的问题,使用因子分解机融合特征,将特征从一维扩展到高维,从而获得特征的低阶表示,然后使用深度神经网络学习高阶特征,并通过一个全连接层将2种特征组合起来,以获得所需的特征表示;其次,针对单头注意力机制过度倾斜权重的问题,使用将输入切分成多个单头分别计算其注意力权重的多头注意力机制,再经由线性变换将各结果进行拼接,获得最终的输出;最后,结合上述2点构建了基于注意力机制与特征融合的推荐模型。为了验证模型的有效性,在4个公开数据集上与基线模型GMF、DeepCF_SPS和CNN-BiLSTM进行了对比实验以及消融实验。实验结果表明,在不同规模的数据集上,所提模型与基线模型相比在MSE、RMSE、MAE评价指标上表现出的性能均更优。 展开更多
关键词 注意力机制 特征融合 推荐模型 评分预测
在线阅读 下载PDF
基于动态自适应通道注意力特征融合的小目标检测
2
作者 吴迪 赵品懿 +2 位作者 甘升隆 沈学军 万琴 《电子科技大学学报》 北大核心 2025年第2期221-232,共12页
针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的... 针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的问题。2)提出一种分组批量动态自适应通道注意力模块,增强弱语义小目标特征同时抑制无用信息,且在动态自适应通道注意力模块中设计新的激活函数和交并比损失函数,提升通道注意力表征能力。3)采用ResNet50作为骨干网络依次连接特征金字塔网络和Tri-Neck网络。实验结果表明,该方法在Pascal Voc 2007、Pascal Voc 2012上比YOLOv8算法mAP分别提升5.3%和6.2%,在MS COCO 2017数据集上AP和AP_S分别提升1.6%和2%,在SODA-D数据集上比YOLOv8算法AP提升0.9%。 展开更多
关键词 小目标检测 多尺度融合特征 特征金字塔 动态通道注意力 交并比损失函数
在线阅读 下载PDF
基于注意力机制和特征融合的井下轻量级人员检测方法
3
作者 王帅 杨伟 +2 位作者 李宇翔 吴佳奇 杨维 《煤炭科学技术》 北大核心 2025年第4期383-392,共10页
煤矿井下环境复杂,安全隐患较多,人员检测是保障煤矿安全生产和建设智慧矿山的重要内容。常用的检测算法不仅参数量大,对设备算力要求高,而且在煤矿低照度环境下的应用效果不理想。针对上述问题,基于YOLOv5提出一种用于煤矿井下的轻量... 煤矿井下环境复杂,安全隐患较多,人员检测是保障煤矿安全生产和建设智慧矿山的重要内容。常用的检测算法不仅参数量大,对设备算力要求高,而且在煤矿低照度环境下的应用效果不理想。针对上述问题,基于YOLOv5提出一种用于煤矿井下的轻量级人员检测方法YOLOv5-CWG。首先,在骨干网络中嵌入坐标注意力机制(Coordinate Attention)自适应的调整特征图中每个通道的权重,增强特征的表达能力,提高模型在低照度、粉尘影响严重以及对比度低的不利条件下对待检测人员目标的关注度,更精确地定位和识别人员目标。其次,通过加权多尺度特征融合模块(Weighted multiscale feature fusion moule)引入可学习的权重赋予特征层不同的关注度,使网络有效融合浅层位置特征和高层语义信息,增强模型的信息提取能力,更好地区分目标区域和背景噪声,从而提高模型的抗干扰能力。增加1个P2层的检测头,提升较小目标的检测和定位精度。引入SIoU损失函数代替原损失函数加快模型收敛。最后,引入Ghost模块优化骨干网络,可以在不损失模型性能的前提下降低模型的参数量,提高检测速度,使得模型更容易部署在资源受限的设备上。结果表明,提出的YOLOv5-CWG算法在煤矿井下人员检测数据集(UMPDD)上的mAP达到了97.5%,相较于YOLOv5s提高了7.3%,计算量减少了27.6%,FPS提高了6.3。所提算法显著提高了煤矿井下人员检测精度,有效解决了亮度低和光照不均引起的人员检测困难问题。 展开更多
关键词 人员检测 YOLOv5 注意力机制 轻量化 特征融合
在线阅读 下载PDF
融合多尺度特征与注意力的小样本目标检测
4
作者 张英俊 甘望阳 +1 位作者 谢斌红 张睿 《小型微型计算机系统》 北大核心 2025年第3期689-696,共8页
针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatia... 针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatial Pyramid Pooling)模块获取不同的感受野,以捕获目标细节信息的多尺度特征.其次,采用Bi-FPN网络进行多尺度特征融合,获得更具代表性的查询特征与支持特征,有效缓解尺度变化问题.然后,利用提出的注意力引导特征增强模块对查询特征与支持特征进行自身关注,使得它们具有更好的判别能力,由此促进查询特征与支持特征的融合,以更好地应对外观变化和遮挡带来的挑战,从而缓解误检、漏检问题.最后,将分类头与边界框回归头进行解耦,分别对RPN网络基于细粒度查询特征产生的候选区域进行目标分类与目标定位.在PASCAL VOC与MS COCO数据集上的实验结果表明,所提模型的检测性能优于主流的小样本目标检测模型,相较于基线模型DCNet,mAP平均分别提升了3.5%与2.1%. 展开更多
关键词 小样本学习 元学习 目标检测 多尺度特征融合 注意力机制
在线阅读 下载PDF
基于特征融合和分块注意力的无人机跟踪算法
5
作者 刘芳 杨雨妍 王鑫 《北京航空航天大学学报》 北大核心 2025年第5期1566-1578,共13页
无人机(UAV)已被广泛应用于各类领域中,目标跟踪是无人机应用的关键技术之一。提出一种基于特征融合和分块注意力的无人机跟踪算法,旨在解决无人机在目标跟踪时面临的外观变化和外界因素干扰等问题。采用Siamese网络提取模板图像和搜索... 无人机(UAV)已被广泛应用于各类领域中,目标跟踪是无人机应用的关键技术之一。提出一种基于特征融合和分块注意力的无人机跟踪算法,旨在解决无人机在目标跟踪时面临的外观变化和外界因素干扰等问题。采用Siamese网络提取模板图像和搜索图像的方向梯度直方图(HOG)特征、颜色(CN)特征和深度卷积特征,自适应计算3种特征权重的大小,增强融合特征的表达能力。采用改进的特征分块注意力机制,增强模板图像特征信息中有效区域的关注度,实现更有效地目标相似度匹配。为降低计算成本,将输出特征向量转换到YCbCr空间后进行离散余弦变换(DCT)并保留低频分量,得到特征响应图,进行分类回归得到最终目标位置。实验表明:所提算法可以降低外观变化、外界因素干扰对跟踪性能的影响,提升目标跟踪的准确性。 展开更多
关键词 无人机 目标跟踪 特征融合 特征分块注意力 Siamese网络
在线阅读 下载PDF
结合注意力特征融合的路面裂缝检测
6
作者 谢永华 厉涛 柏勇 《计算机工程与设计》 北大核心 2025年第1期307-313,共7页
为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重... 为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重,突出有用信息,解决裂缝漏检问题;在编码器部分,改进浅层特征与深层特征的选取方式,提升特征融合效果和检测精度。实验结果表明,该网络在各项指标上均优于其它对比网络,具有较高的检测精度。 展开更多
关键词 裂缝检测 深度学习 语义分割 卷积网络 注意力机制 特征融合 特征提取
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法
7
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-Transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
并行池化注意力及多特征融合增强目标检测方法 被引量:1
8
作者 程杰 卞长智 +2 位作者 张婧 李小霞 丁楠 《现代电子技术》 北大核心 2025年第5期59-67,共9页
针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加... 针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加强边缘纹理等细节信息;方向感知池化模块捕获图像在垂直和水平方向上的空间方向信息,再计算通道均值实现逐步降维保留关键特征。其次,多特征融合增强模块利用特征图尺度的对数函数自适应选取卷积核的大小,再将卷积后的特征分组重塑为与输入图像维度相同的通道、高度和宽度方向上的三个特征子图,并进行元素相乘获得增强特征图。最后,增强特征图与输入图像加权融合,同时增强目标的位置和细节信息。实验结果表明,文中方法在参数量不变的情况下,在VOC2007数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.62%、4.46%,在COCO数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.57%、4.63%。 展开更多
关键词 通道注意力 降维 并行池化 特征融合增强 自适应 目标检测
在线阅读 下载PDF
三维人体姿态和形状估计的分层注意力时空特征融合算法
9
作者 闫卓越 刘骊 +2 位作者 付晓东 刘利军 彭玮 《图学学报》 北大核心 2025年第4期746-755,共10页
基于单目视频的三维人体姿态和形状估计在虚拟试衣和影视特效制作等领域具有重要作用。针对基于单目视频的三维人体姿态和形状估计中的人体建模不充分、时空表征较单一、估计精准性受限的问题,提出三维人体姿态和形状估计的分层注意力... 基于单目视频的三维人体姿态和形状估计在虚拟试衣和影视特效制作等领域具有重要作用。针对基于单目视频的三维人体姿态和形状估计中的人体建模不充分、时空表征较单一、估计精准性受限的问题,提出三维人体姿态和形状估计的分层注意力时空特征融合算法。首先使用分层注意力对人体部位进行分层空间建模,得到可学习的人体姿态空间特征;然后将可学习的人体姿态空间特征与参数人体模板结合,共同指导人体运动时序特征进行时空建模,实现时空特征融合;最后提出三维人体姿态和形状联合优化方法,使用多层感知机回归更加精准且平滑的三维人体网格。在Human3.6M数据集上的实验结果表明,该方法在评估指标MPJPE和ACC-ERR上的数值分别为56.1 mm和3.4 mm/s^(2),较现有方法相比降低了0.5%和5.6%,能够提高三维人体姿态和形状估计的精度,生成精准且平滑的三维人体网格。此外,在3DPW数据集和互联网视频的测试结果表明,在面对快速运动等场景时,也具有一定的鲁棒性。 展开更多
关键词 三维人体姿态和形状估计 分层注意力 时空建模 时空特征融合 姿态和形状联合优化
在线阅读 下载PDF
基于注意力机制和跨模态层级特征融合的群养肉牛个体质量估测
10
作者 宋平 杨颖 +3 位作者 刘刚 姚冲 李子若 毛天赐 《农业工程学报》 北大核心 2025年第10期221-231,共11页
为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-g... 为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-green-blue)图像与深度图像,使用引入定向边界框OBB(oriented bounding box)的YOLOv8网络对肉牛进行旋转目标检测和识别,精准定位群养场景中的个体目标;其次,以ResNet50为骨干网络构建双流估重模型,分别提取RGB和深度模态特征,并引入CBAM(convolutional block attention module)注意力机制以增强关键特征表达能力。设计跨模态的层级特征融合,有效结合RGB流和深度流的特征并充分利用浅层特征;第三,引入肉牛的身份信息便于网络学习肉牛身份与其体质量之间的对应关系,为优化模型效率,将全连接层替换为KAN(kolmogorov-arnold networks),显著减少参数量;最后,将双流的输出结果融合,回归肉牛体质量值。在试验中,构建了包含2546对RGB-D图像的数据集,包括2373对训练数据和173对验证数据。结果表明,CMHFF-ResNet在验证集上的平均绝对误差为14.19 kg。与基于RGB和深度的单流模型相比,双流模型在平均绝对误差上分别降低16.943%和26.133%。同时,该方法优于其他现有肉牛体质量估测方法:与多元线性回归、改进MobileNetv2模型、改进DenseNet201模型和改进跨模态特征融合模型CFF-ResNet相比,在平均绝对误差上分别减少57.233%、34.699%、24.761%和20.991%,提升了群养环境下肉牛个体质量估测的精度与泛化性,能够有效地学习跨模态的层级特征表示。该研究为大规模群养环境中肉牛个体质量的高精度估测提供了参考。 展开更多
关键词 模型 计算机视觉 目标检测 体质量估测 注意力机制 跨模态层级特征融合 双流网络
在线阅读 下载PDF
基于流序列特征融合与注意力机制的加密流量分类方法
11
作者 李志远 吴安昊 +1 位作者 谭林 卜凡亮 《小型微型计算机系统》 北大核心 2025年第7期1718-1726,共9页
现有加密流量分类方法中对缺少对流量字节本身特征的研究,存在特征冗余、流量表征方式不全面和公开数据集中样本分布不平衡等问题.为解决上述问题,本文提出了一种基于流序列特征融合与注意力机制的加密流量分类方法SFAN(Stream Feature ... 现有加密流量分类方法中对缺少对流量字节本身特征的研究,存在特征冗余、流量表征方式不全面和公开数据集中样本分布不平衡等问题.为解决上述问题,本文提出了一种基于流序列特征融合与注意力机制的加密流量分类方法SFAN(Stream Feature Attention Network).首先,针对特征冗余问题,提出了一个基于混合神经网络的特征提取方法;其次,针对流量表征问题,结合流量原始字节序列与数据包长度序列表征网络流量,再利用注意力机制衡量不同特征的重要性;最后,针对公开数据集中样本分布不平衡的问题,在模型训练层面优化损失函数提高分类精度.利用公开数据集ISCX VPN-nonVPN进行了广泛的实验,SFAN的总体准确率达到98.49%,F1值为98.03%.实验表明,所提出的加密流量分类方法能够有效识别不同应用程序产生的网络流量. 展开更多
关键词 加密流量分类 混合神经网络 多维度特征融合 注意力机制
在线阅读 下载PDF
结合注意力机制和多尺度特征融合的三维手部姿态估计
12
作者 郭诗月 党建武 +1 位作者 王阳萍 雍玖 《计算机应用》 北大核心 2025年第4期1293-1299,共7页
针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(S... 针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(SEM),以替换沙漏网络(HGNet)中的基本块(Basicblock),在扩大感受野的同时增强对空间信息的敏感性,从而提高手部特征的提取能力;其次,设计一种结合SPCNet(Spatial Preserve and Contentaware Network)和Soft-Attention改进的多尺度信息融合模块SS-MIFM(SPCNet and Soft-attention-Multi-scale Information Fusion Module),在充分考虑空间内容感知机制的情况下,有效地聚合多级特征,并显著提高二维手部关键点检测的准确性;最后,利用2.5D姿态转换模块将二维姿态转换为三维姿态,从而避免二维关键点坐标直接回归计算三维姿态信息导致的空间丢失问题。实验结果表明,在InterHand2.6M数据集上,所提算法的双手关节点平均误差(MPJPE)、单手MPJPE和根节点平均误差(MRRPE)分别达到了12.32、9.96和29.57 mm;在RHD(Rendered Hand pose Dataset)上,与InterNet和QMGR-Net算法相比,所提算法的终点误差(EPE)分别降低了2.68和0.38 mm。以上结果说明了所提算法能够更准确地估计手部姿态,且在一些双手交互和遮挡的场景下有更高的鲁棒性。 展开更多
关键词 手部姿态估计 多尺度特征融合 注意力机制 高分辨率网络 沙漏网络
在线阅读 下载PDF
基于窗口自注意力特征融合的感知图像认证哈希
13
作者 周元鼎 高国鹏 +1 位作者 房耀东 秦川 《计算机研究与发展》 北大核心 2025年第7期1786-1796,共11页
随着多媒体和互联网技术的快速发展,数字图像内容的安全性问题日益突出.为此,提出了一种基于窗口自注意力特征融合的深度感知图像认证哈希方案,该方案能有效检测原始图像的感知内容是否发生变化,并可应用于内容认证、复制检测、篡改识... 随着多媒体和互联网技术的快速发展,数字图像内容的安全性问题日益突出.为此,提出了一种基于窗口自注意力特征融合的深度感知图像认证哈希方案,该方案能有效检测原始图像的感知内容是否发生变化,并可应用于内容认证、复制检测、篡改识别等场合.该方案以卷积神经网络为基础,利用窗口自注意力构建了一个融合图像全局和局部特征的哈希模型.模型首先对主干网络获得的浅层特征进行分块并提取相应的窗口特征,然后计算每个局部特征与全局特征之间的相关性来筛选出最终的局部特征,再将这部分特征和全局特征输入到哈希生成模块中进行融合与压缩,得到最终的图像哈希码.在训练过程中,利用哈希损失和分类损失构造的联合损失函数对模型进行约束,提高感知认证哈希方案的鲁棒性和唯一性.实验结果表明,与现有典型的感知认证哈希方案相比,所提方案可获得更优的图像内容认证性能. 展开更多
关键词 感知哈希 图像认证 窗口自注意力 特征融合 鲁棒性
在线阅读 下载PDF
基于多尺度注意力与特征融合的行人重识别方法研究
14
作者 吴宇森 于宝华 +1 位作者 荣江 张数 《石河子大学学报(自然科学版)》 北大核心 2025年第1期122-132,共11页
行人重识别又称行人再识别,是一种在跨摄像头环境下识别相同行人的技术。目前,由于行人姿势变化、灯光角度、障碍遮挡等问题影响,导致现有方法提取行人特征受到干扰较大,影响识别效果。针对该问题,提出将NFormer嵌入主干网络的不同层级... 行人重识别又称行人再识别,是一种在跨摄像头环境下识别相同行人的技术。目前,由于行人姿势变化、灯光角度、障碍遮挡等问题影响,导致现有方法提取行人特征受到干扰较大,影响识别效果。针对该问题,提出将NFormer嵌入主干网络的不同层级,构建多尺度注意力模块(Multi-Scale Attention-NFormer, MSAN),提取细节丰富的底层特征与表征能力强的高层特征进行融合;提出结合可学习视觉中心与多层感知器,构建了基于可学习视觉中心与多层感知器的特征融合模块(Feature Fusion with Learnable Visual Centers and Multilayer Perceptron, FFLM),提取关联位置信息的局部特征与长距离依赖的全局特征,并将其融合获取更具辨别性的特征表达。为了使主干网络与头部网络更适用于特征融合任务,对ResNet50的激活函数和搭建架构进行改进,保留了更丰富的特征信息;在头部网络添加BN层和GeM池化,缓解了损失函数优化方向不同步的问题。实验结果表明,所提方法在Market-1501和DukeMTMC-reID数据集上的首位命中率分别达到了95.8%、90.2%,平均精度均值为93.0%、84.7%,所提取的特征更具有判别性,识别率更高。 展开更多
关键词 行人重识别 特征融合 多尺度 注意力机制 深度学习
在线阅读 下载PDF
基于残差注意力与特征融合的无参考图像质量评价方法
15
作者 闫嘉阔 司占军 《印刷与数字媒体技术研究》 北大核心 2025年第2期56-64,共9页
目前基于深度学习的无参考图像质量评价方法存在图像语义特征提取不充分或图像语义感知不足等问题。因此,本研究提出了一种改进方法,利用残差注意力和特征融合来进行无参考图像质量评价。首先,使用Resnet-50网络提取图像的低阶特征,然... 目前基于深度学习的无参考图像质量评价方法存在图像语义特征提取不充分或图像语义感知不足等问题。因此,本研究提出了一种改进方法,利用残差注意力和特征融合来进行无参考图像质量评价。首先,使用Resnet-50网络提取图像的低阶特征,然后通过残差双注意力模块增强提取的特征,以有效学习关键信息并更新权重,从而提高对图像特征的关注度并提取高阶特征。使用语义感知网络生成相应的权值参数,通过特征融合模块将不同阶段的高低阶特征进行融合,以丰富高级特征图中不同层级之间的语义和位置信息,并捕捉局部和全局失真。最后,结合全局图像信息和局部图像信息,根据图像内容获取的相应参数,对图像质量进行预测。实验结果表明,本研究提出的方法在预测失真图像质量时能够充分挖掘失真图像的高级语义信息,有效解决真实失真场景下失真图像内容变化和未知失真类型复杂的问题。在复杂的失真情况下,本研究方法仍能准确评价图像质量,并具有较强的泛化能力。 展开更多
关键词 无参考图像质量评价 残差注意力 特征融合 语义感知
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的视频异常检测方法
16
作者 吴祥 肖剑 吉根林 《应用科学学报》 北大核心 2025年第2期234-244,共11页
视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限... 视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限制了其异常检测的性能。针对该问题,本文基于生成对抗网络结构,提出了一种基于多尺度特征融合和注意力机制的视频异常检测方法。使用大小不同的卷积核捕获不同感受野的特征,并将它们进行融合以获得多尺度的特征表示。此外,在生成器的转置卷积层后引入坐标注意力机制,自适应分配特征图权重,从而增强模型对关键特征的感知能力。在公开数据集UCSD Ped2和Avenue上的实验结果表明,本文方法的性能优于其他同类方法。 展开更多
关键词 视频异常检测 深度学习 生成对抗网络 多尺度特征融合 注意力机制
在线阅读 下载PDF
残差混合注意力与自适应特征融合的脑肿瘤分割
17
作者 吴进旭 吴云 《计算机应用研究》 北大核心 2025年第8期2525-2531,共7页
脑肿瘤图像的自动化分割在脑肿瘤的辅助诊断和治疗方面至关重要。针对脑肿瘤图像病变区域复杂多变、病灶与背景区域边界模糊的问题,提出了一种结合残差混合注意力、自适应特征融合的脑肿瘤分割方法(residual adaptive convolution-Net,R... 脑肿瘤图像的自动化分割在脑肿瘤的辅助诊断和治疗方面至关重要。针对脑肿瘤图像病变区域复杂多变、病灶与背景区域边界模糊的问题,提出了一种结合残差混合注意力、自适应特征融合的脑肿瘤分割方法(residual adaptive convolution-Net,RAC-Net)。首先,使用双动态卷积增强(dual dynamic convolution enhancement,DDCE)模块以实现更灵活的特征提取和增强模型的适应能力;然后,引入残差混合注意力(residual mixed attention,RMA)模块,以充分提取图像的全局与局部特征;最后,在解码路径中使用自适应特征融合(adaptive feature fusion module,AF2M)模块来对深层与浅层特征进行融合,以获取更丰富的特征信息。在公共数据集BraTS2019与BraTS2021上进行实验,并使用数据集BraTS2023进行跨数据集验证,结果显示RAC-Net的大部分指标均优于现有主流分割方法,说明该分割方法对临床相关脑肿瘤疾病的辅助诊断具有一定的应用价值。 展开更多
关键词 脑肿瘤分割 自适应特征融合 残差混合注意力 双动态卷积增强
在线阅读 下载PDF
内外特征交互与融合的双流注意力图像修复方法
18
作者 黄光远 黄荣 +1 位作者 周树波 蒋学芹 《电子学报》 北大核心 2025年第4期1293-1307,共15页
注意力机制及其变体已广泛应用于基于深度学习的图像修复领域,它们将破损图像内部分为完好区域和缺失区域,捕获完好区域的远距离上下文信息以填充缺失区域.随着缺失区域增大,完好区域特征减少,限制了注意力机制的性能,从而导致修复效果... 注意力机制及其变体已广泛应用于基于深度学习的图像修复领域,它们将破损图像内部分为完好区域和缺失区域,捕获完好区域的远距离上下文信息以填充缺失区域.随着缺失区域增大,完好区域特征减少,限制了注意力机制的性能,从而导致修复效果不佳.为拓展注意力机制捕获上下文的范围,本文通过矢量量化码本学习视觉原子.这些视觉原子刻画了图像块的结构、纹理等特征,组成用于图像修复的外部特征,以弥补图像内部完好区域特征的不足.在此基础上,本文提出一种内外特征交互与融合的双流注意力图像修复方法.该方法结合内部和外部两个信息源,设计了内部掩码注意力和内外交叉注意力,组成双流注意力以实现内部特征之间以及内部和外部特征之间的交互,生成内外源修复特征.内部掩码注意力通过掩码屏蔽缺失区域特征的干扰,仅在完好区域捕获上下文信息,生成内源修复特征.内外交叉注意力通过计算内部特征与由视觉原子组成的外部特征之间的相似度关系,实现内外特征之间的交互,生成外源修复特征.此外,本文设计了可控特征融合模块,利用内外源修复特征之间的相关性生成空间权重图,为每个空间位置精确地筛选内外源修复特征,从而实现内部与外部特征的融合.在Places2、FFHQ和Paris StreetView三个公开的数据集上的实验结果表明本文方法在PSNR、SSIM、L1、LPIPS和FID指标上比其他先进方法平均提高了3.45%、1.34%、13.91%、13.64%和16.92%.消融实验结果和可视化实验结果表明图像内部特征与由视觉原子组成的外部特征均有益于修复破损图像. 展开更多
关键词 图像修复 矢量量化码本 视觉原子 掩码注意力 交叉注意力 特征融合
在线阅读 下载PDF
结合特征融合和通道注意力的多分支换装行人重识别
19
作者 胡涌涛 黄洪琼 《计算机工程》 北大核心 2025年第1期225-234,共10页
换装行人重识别(CC Re-ID)是行人重识别中的一个新兴研究课题,旨在找出被换衣的行人。当前方法主要集中在使用多模态数据辅助解耦表征学习,如通过脸、步态、身体轮廓等辅助数据解耦行人自身属性以减少服装影响,但这些方法泛化能力较差,... 换装行人重识别(CC Re-ID)是行人重识别中的一个新兴研究课题,旨在找出被换衣的行人。当前方法主要集中在使用多模态数据辅助解耦表征学习,如通过脸、步态、身体轮廓等辅助数据解耦行人自身属性以减少服装影响,但这些方法泛化能力较差,需要大量额外工作。此外,仅使用原始数据的方法对于相关信息的提取不够充分,性能较弱。针对CC Re-ID存在的上述问题,提出一种结合特征融合和通道注意力的多分支换装行人重识别方法(MBFC)。通过在主干网络中融入通道注意力机制,在特征通道层面学习关键信息,设计局部与全局特征融合方法以提高网络对行人细粒度特征的提取能力。此外,MBFC模型采用多分支结构,使用服装对抗损失、交叉熵标签平滑损失等多种损失函数引导模型学习与服装无关的信息,减少服装对模型的影响,从而提取到更有效的行人信息。在PRCC和VC-Clothes数据集上进行广泛实验,结果表明,所提模型在RANK-1和平均精度均值(mAP)指标上优于对比的CC Re-ID方法。 展开更多
关键词 换装行人重识别 多分支 通道注意力 特征融合 注意力机制
在线阅读 下载PDF
基于融合注意力和多尺度特征的热轧带钢表面缺陷检测方法
20
作者 包广清 周芷意 孟庆成 《北京工业大学学报》 北大核心 2025年第8期944-956,共13页
针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,... 针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,引入遗传算法(genetic algorithm, GA)以获得更具代表性的锚框尺寸,并提升模型的回归速度和小面积缺陷检测的精确度。其次,对于边界模糊且背景复杂的缺陷,提出一种目标检测边界框损失函数FocalSIoU,以减少模型中不必要特征的学习,加快检测速度,提升预测框的回归效果。最后,设计一种多尺度特征融合模块(multi-scale feature fusion module, MFFM),通过多尺度信息融合增强模型特征提取能力,提高小目标的检测精确度,并改善模型检测误检率。在模型Head结构中引入空到深(space to depth, SPD)卷积模块对模型进行改进,避免细粒度信息的丢失,降低目标漏检率。通过NEU-DET数据集进行验证,结果表明,SFSP-YOLOv7模型检测的平均精度均值(mean average precision, mAP)为78.3%,相比原YOLOv7模型提升了5.0个百分点,表明提出的检测方法具有有效性。 展开更多
关键词 带钢表面缺陷检测 深度学习 YOLOv7 损失函数 注意力机制 多尺度特征融合
在线阅读 下载PDF
上一页 1 2 63 下一页 到第
使用帮助 返回顶部