期刊文献+
共找到1,250篇文章
< 1 2 63 >
每页显示 20 50 100
基于动态自适应通道注意力特征融合的小目标检测 被引量:1
1
作者 吴迪 赵品懿 +2 位作者 甘升隆 沈学军 万琴 《电子科技大学学报》 北大核心 2025年第2期221-232,共12页
针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的... 针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的问题。2)提出一种分组批量动态自适应通道注意力模块,增强弱语义小目标特征同时抑制无用信息,且在动态自适应通道注意力模块中设计新的激活函数和交并比损失函数,提升通道注意力表征能力。3)采用ResNet50作为骨干网络依次连接特征金字塔网络和Tri-Neck网络。实验结果表明,该方法在Pascal Voc 2007、Pascal Voc 2012上比YOLOv8算法mAP分别提升5.3%和6.2%,在MS COCO 2017数据集上AP和AP_S分别提升1.6%和2%,在SODA-D数据集上比YOLOv8算法AP提升0.9%。 展开更多
关键词 小目标检测 多尺度融合特征 特征金字塔 动态通道注意力 交并比损失函数
在线阅读 下载PDF
基于注意力机制和特征融合的井下轻量级人员检测方法 被引量:1
2
作者 王帅 杨伟 +2 位作者 李宇翔 吴佳奇 杨维 《煤炭科学技术》 北大核心 2025年第4期383-392,共10页
煤矿井下环境复杂,安全隐患较多,人员检测是保障煤矿安全生产和建设智慧矿山的重要内容。常用的检测算法不仅参数量大,对设备算力要求高,而且在煤矿低照度环境下的应用效果不理想。针对上述问题,基于YOLOv5提出一种用于煤矿井下的轻量... 煤矿井下环境复杂,安全隐患较多,人员检测是保障煤矿安全生产和建设智慧矿山的重要内容。常用的检测算法不仅参数量大,对设备算力要求高,而且在煤矿低照度环境下的应用效果不理想。针对上述问题,基于YOLOv5提出一种用于煤矿井下的轻量级人员检测方法YOLOv5-CWG。首先,在骨干网络中嵌入坐标注意力机制(Coordinate Attention)自适应的调整特征图中每个通道的权重,增强特征的表达能力,提高模型在低照度、粉尘影响严重以及对比度低的不利条件下对待检测人员目标的关注度,更精确地定位和识别人员目标。其次,通过加权多尺度特征融合模块(Weighted multiscale feature fusion moule)引入可学习的权重赋予特征层不同的关注度,使网络有效融合浅层位置特征和高层语义信息,增强模型的信息提取能力,更好地区分目标区域和背景噪声,从而提高模型的抗干扰能力。增加1个P2层的检测头,提升较小目标的检测和定位精度。引入SIoU损失函数代替原损失函数加快模型收敛。最后,引入Ghost模块优化骨干网络,可以在不损失模型性能的前提下降低模型的参数量,提高检测速度,使得模型更容易部署在资源受限的设备上。结果表明,提出的YOLOv5-CWG算法在煤矿井下人员检测数据集(UMPDD)上的mAP达到了97.5%,相较于YOLOv5s提高了7.3%,计算量减少了27.6%,FPS提高了6.3。所提算法显著提高了煤矿井下人员检测精度,有效解决了亮度低和光照不均引起的人员检测困难问题。 展开更多
关键词 人员检测 YOLOv5 注意力机制 轻量化 特征融合
在线阅读 下载PDF
融合多尺度特征与注意力的小样本目标检测 被引量:1
3
作者 张英俊 甘望阳 +1 位作者 谢斌红 张睿 《小型微型计算机系统》 北大核心 2025年第3期689-696,共8页
针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatia... 针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatial Pyramid Pooling)模块获取不同的感受野,以捕获目标细节信息的多尺度特征.其次,采用Bi-FPN网络进行多尺度特征融合,获得更具代表性的查询特征与支持特征,有效缓解尺度变化问题.然后,利用提出的注意力引导特征增强模块对查询特征与支持特征进行自身关注,使得它们具有更好的判别能力,由此促进查询特征与支持特征的融合,以更好地应对外观变化和遮挡带来的挑战,从而缓解误检、漏检问题.最后,将分类头与边界框回归头进行解耦,分别对RPN网络基于细粒度查询特征产生的候选区域进行目标分类与目标定位.在PASCAL VOC与MS COCO数据集上的实验结果表明,所提模型的检测性能优于主流的小样本目标检测模型,相较于基线模型DCNet,mAP平均分别提升了3.5%与2.1%. 展开更多
关键词 小样本学习 元学习 目标检测 多尺度特征融合 注意力机制
在线阅读 下载PDF
结合注意力特征融合的路面裂缝检测 被引量:2
4
作者 谢永华 厉涛 柏勇 《计算机工程与设计》 北大核心 2025年第1期307-313,共7页
为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重... 为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重,突出有用信息,解决裂缝漏检问题;在编码器部分,改进浅层特征与深层特征的选取方式,提升特征融合效果和检测精度。实验结果表明,该网络在各项指标上均优于其它对比网络,具有较高的检测精度。 展开更多
关键词 裂缝检测 深度学习 语义分割 卷积网络 注意力机制 特征融合 特征提取
在线阅读 下载PDF
基于注意力机制的特征融合推荐模型 被引量:1
5
作者 马汉达 李腾飞 《计算机工程与科学》 北大核心 2025年第5期902-911,共10页
针对目前推荐系统难以获得特征信息,缺乏有效的方法来表示特征信息的权重的问题,提出了一种基于注意力机制与特征融合的推荐模型FFADeepCF_SPS。首先,针对特征表示不够充分的问题,使用因子分解机融合特征,将特征从一维扩展到高维,从而... 针对目前推荐系统难以获得特征信息,缺乏有效的方法来表示特征信息的权重的问题,提出了一种基于注意力机制与特征融合的推荐模型FFADeepCF_SPS。首先,针对特征表示不够充分的问题,使用因子分解机融合特征,将特征从一维扩展到高维,从而获得特征的低阶表示,然后使用深度神经网络学习高阶特征,并通过一个全连接层将2种特征组合起来,以获得所需的特征表示;其次,针对单头注意力机制过度倾斜权重的问题,使用将输入切分成多个单头分别计算其注意力权重的多头注意力机制,再经由线性变换将各结果进行拼接,获得最终的输出;最后,结合上述2点构建了基于注意力机制与特征融合的推荐模型。为了验证模型的有效性,在4个公开数据集上与基线模型GMF、DeepCF_SPS和CNN-BiLSTM进行了对比实验以及消融实验。实验结果表明,在不同规模的数据集上,所提模型与基线模型相比在MSE、RMSE、MAE评价指标上表现出的性能均更优。 展开更多
关键词 注意力机制 特征融合 推荐模型 评分预测
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法 被引量:1
6
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-Transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
基于双分支注意力特征融合的跨域行人重识别
7
作者 马建红 靳岩 +1 位作者 王亚辉 谷保平 《郑州大学学报(理学版)》 北大核心 2025年第6期51-57,共7页
无监督跨域行人重识别技术,通过将源域的有标签信息迁移到目标域以应对无标签情况,采用聚类方法达到无监督域适应效果,实现跨域行人再识别。然而,仅依赖全局特征的聚类易受域间差异影响产生噪声,且单网络结构训练易导致放大误差影响模... 无监督跨域行人重识别技术,通过将源域的有标签信息迁移到目标域以应对无标签情况,采用聚类方法达到无监督域适应效果,实现跨域行人再识别。然而,仅依赖全局特征的聚类易受域间差异影响产生噪声,且单网络结构训练易导致放大误差影响模型性能。针对此类问题,提出一种双分支注意力特征融合算法,分别抽取并融合域不变特征和域特定特征,以增强目标域上的泛化能力和减少聚类噪声。同时,引入对称网络架构进行同步协同训练,形成互为监督的学习机制,有效抑制过拟合问题。实验表明,在Market-1501和DukeMTMC-ReID公开数据集上,该算法显著提升了无监督跨域行人重识别的mAP和Rank准确率。 展开更多
关键词 行人重识别 无监督域适应 注意力机制 特征融合
在线阅读 下载PDF
基于自适应特征融合金字塔与注意力机制的输电线路绝缘子缺陷检测方法
8
作者 翟永杰 翟邦朝 +3 位作者 胡哲东 杨珂 王乾铭 赵晓瑜 《图学学报》 北大核心 2025年第5期950-959,共10页
针对输电线路绝缘子缺陷样本中存在的复杂背景干扰及缺陷区域尺度不一问题,提出了一种基于自适应融合特征金字塔与注意力机制的输电线路绝缘子缺陷检测方法。首先,利用自适应融合模块(AF)来处理不同尺度的特征信息,并将其集成到特征金... 针对输电线路绝缘子缺陷样本中存在的复杂背景干扰及缺陷区域尺度不一问题,提出了一种基于自适应融合特征金字塔与注意力机制的输电线路绝缘子缺陷检测方法。首先,利用自适应融合模块(AF)来处理不同尺度的特征信息,并将其集成到特征金字塔网络之中,以缓解绝缘子航拍图像中存在的缺陷区域尺度不一问题。然后,基于注意力机制的缺陷特征细化模块(DFRM),通过增大感受野以及捕获缺陷区域的上下文特征来应对复杂背景噪声所带来的干扰。最后,将改进后的算法应用到真实输电线路绝缘子缺陷数据集进行实验。实验结果表明,该方法在绝缘子缺陷检测任务中优于其他方法,相较于基线模型准确率提升了5.7%,为电网智能巡检提供了一种有效方案。 展开更多
关键词 绝缘子缺陷 特征融合 注意力机制 目标检测 多尺度特征
在线阅读 下载PDF
基于特征融合和分块注意力的无人机跟踪算法
9
作者 刘芳 杨雨妍 王鑫 《北京航空航天大学学报》 北大核心 2025年第5期1566-1578,共13页
无人机(UAV)已被广泛应用于各类领域中,目标跟踪是无人机应用的关键技术之一。提出一种基于特征融合和分块注意力的无人机跟踪算法,旨在解决无人机在目标跟踪时面临的外观变化和外界因素干扰等问题。采用Siamese网络提取模板图像和搜索... 无人机(UAV)已被广泛应用于各类领域中,目标跟踪是无人机应用的关键技术之一。提出一种基于特征融合和分块注意力的无人机跟踪算法,旨在解决无人机在目标跟踪时面临的外观变化和外界因素干扰等问题。采用Siamese网络提取模板图像和搜索图像的方向梯度直方图(HOG)特征、颜色(CN)特征和深度卷积特征,自适应计算3种特征权重的大小,增强融合特征的表达能力。采用改进的特征分块注意力机制,增强模板图像特征信息中有效区域的关注度,实现更有效地目标相似度匹配。为降低计算成本,将输出特征向量转换到YCbCr空间后进行离散余弦变换(DCT)并保留低频分量,得到特征响应图,进行分类回归得到最终目标位置。实验表明:所提算法可以降低外观变化、外界因素干扰对跟踪性能的影响,提升目标跟踪的准确性。 展开更多
关键词 无人机 目标跟踪 特征融合 特征分块注意力 Siamese网络
在线阅读 下载PDF
结合特征融合与混合注意力的细粒度图像分类
10
作者 潘卫华 魏明月 苏攀 《计算机应用与软件》 北大核心 2025年第9期210-219,共10页
为充分提取细粒度图像中的局部关键特征,提出特征融合与混合注意力相结合的细粒度图像分类算法。该文利用SE(Squeeze-and-Excitation Networks)引入通道注意力,提高特征提取能力;提出特征融合,充分融合跨通道交互后的低层和高层语义信息... 为充分提取细粒度图像中的局部关键特征,提出特征融合与混合注意力相结合的细粒度图像分类算法。该文利用SE(Squeeze-and-Excitation Networks)引入通道注意力,提高特征提取能力;提出特征融合,充分融合跨通道交互后的低层和高层语义信息;改进选择性稀疏采样(Selective Sparse Sampling,S3N)方法引入空间注意力获取显著采样图;构造一个能够端到端训练的两分支分类模型,以交叉验证的方式提高分类准确率。该算法在CUB-200-2011、FGVC-Aircraft和Stanford Cars数据集上分别达到了87.84%、93.59%和94.25%的分类准确率,优于骨干网络和当前主流算法。 展开更多
关键词 细粒度图像分类 通道注意力 空间采样 特征融合 交叉验证
在线阅读 下载PDF
并行池化注意力及多特征融合增强目标检测方法 被引量:1
11
作者 程杰 卞长智 +2 位作者 张婧 李小霞 丁楠 《现代电子技术》 北大核心 2025年第5期59-67,共9页
针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加... 针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加强边缘纹理等细节信息;方向感知池化模块捕获图像在垂直和水平方向上的空间方向信息,再计算通道均值实现逐步降维保留关键特征。其次,多特征融合增强模块利用特征图尺度的对数函数自适应选取卷积核的大小,再将卷积后的特征分组重塑为与输入图像维度相同的通道、高度和宽度方向上的三个特征子图,并进行元素相乘获得增强特征图。最后,增强特征图与输入图像加权融合,同时增强目标的位置和细节信息。实验结果表明,文中方法在参数量不变的情况下,在VOC2007数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.62%、4.46%,在COCO数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.57%、4.63%。 展开更多
关键词 通道注意力 降维 并行池化 特征融合增强 自适应 目标检测
在线阅读 下载PDF
三维人体姿态和形状估计的分层注意力时空特征融合算法
12
作者 闫卓越 刘骊 +2 位作者 付晓东 刘利军 彭玮 《图学学报》 北大核心 2025年第4期746-755,共10页
基于单目视频的三维人体姿态和形状估计在虚拟试衣和影视特效制作等领域具有重要作用。针对基于单目视频的三维人体姿态和形状估计中的人体建模不充分、时空表征较单一、估计精准性受限的问题,提出三维人体姿态和形状估计的分层注意力... 基于单目视频的三维人体姿态和形状估计在虚拟试衣和影视特效制作等领域具有重要作用。针对基于单目视频的三维人体姿态和形状估计中的人体建模不充分、时空表征较单一、估计精准性受限的问题,提出三维人体姿态和形状估计的分层注意力时空特征融合算法。首先使用分层注意力对人体部位进行分层空间建模,得到可学习的人体姿态空间特征;然后将可学习的人体姿态空间特征与参数人体模板结合,共同指导人体运动时序特征进行时空建模,实现时空特征融合;最后提出三维人体姿态和形状联合优化方法,使用多层感知机回归更加精准且平滑的三维人体网格。在Human3.6M数据集上的实验结果表明,该方法在评估指标MPJPE和ACC-ERR上的数值分别为56.1 mm和3.4 mm/s^(2),较现有方法相比降低了0.5%和5.6%,能够提高三维人体姿态和形状估计的精度,生成精准且平滑的三维人体网格。此外,在3DPW数据集和互联网视频的测试结果表明,在面对快速运动等场景时,也具有一定的鲁棒性。 展开更多
关键词 三维人体姿态和形状估计 分层注意力 时空建模 时空特征融合 姿态和形状联合优化
在线阅读 下载PDF
基于注意力机制和跨模态层级特征融合的群养肉牛个体质量估测
13
作者 宋平 杨颖 +3 位作者 刘刚 姚冲 李子若 毛天赐 《农业工程学报》 北大核心 2025年第10期221-231,共11页
为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-g... 为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-green-blue)图像与深度图像,使用引入定向边界框OBB(oriented bounding box)的YOLOv8网络对肉牛进行旋转目标检测和识别,精准定位群养场景中的个体目标;其次,以ResNet50为骨干网络构建双流估重模型,分别提取RGB和深度模态特征,并引入CBAM(convolutional block attention module)注意力机制以增强关键特征表达能力。设计跨模态的层级特征融合,有效结合RGB流和深度流的特征并充分利用浅层特征;第三,引入肉牛的身份信息便于网络学习肉牛身份与其体质量之间的对应关系,为优化模型效率,将全连接层替换为KAN(kolmogorov-arnold networks),显著减少参数量;最后,将双流的输出结果融合,回归肉牛体质量值。在试验中,构建了包含2546对RGB-D图像的数据集,包括2373对训练数据和173对验证数据。结果表明,CMHFF-ResNet在验证集上的平均绝对误差为14.19 kg。与基于RGB和深度的单流模型相比,双流模型在平均绝对误差上分别降低16.943%和26.133%。同时,该方法优于其他现有肉牛体质量估测方法:与多元线性回归、改进MobileNetv2模型、改进DenseNet201模型和改进跨模态特征融合模型CFF-ResNet相比,在平均绝对误差上分别减少57.233%、34.699%、24.761%和20.991%,提升了群养环境下肉牛个体质量估测的精度与泛化性,能够有效地学习跨模态的层级特征表示。该研究为大规模群养环境中肉牛个体质量的高精度估测提供了参考。 展开更多
关键词 模型 计算机视觉 目标检测 体质量估测 注意力机制 跨模态层级特征融合 双流网络
在线阅读 下载PDF
基于流序列特征融合与注意力机制的加密流量分类方法
14
作者 李志远 吴安昊 +1 位作者 谭林 卜凡亮 《小型微型计算机系统》 北大核心 2025年第7期1718-1726,共9页
现有加密流量分类方法中对缺少对流量字节本身特征的研究,存在特征冗余、流量表征方式不全面和公开数据集中样本分布不平衡等问题.为解决上述问题,本文提出了一种基于流序列特征融合与注意力机制的加密流量分类方法SFAN(Stream Feature ... 现有加密流量分类方法中对缺少对流量字节本身特征的研究,存在特征冗余、流量表征方式不全面和公开数据集中样本分布不平衡等问题.为解决上述问题,本文提出了一种基于流序列特征融合与注意力机制的加密流量分类方法SFAN(Stream Feature Attention Network).首先,针对特征冗余问题,提出了一个基于混合神经网络的特征提取方法;其次,针对流量表征问题,结合流量原始字节序列与数据包长度序列表征网络流量,再利用注意力机制衡量不同特征的重要性;最后,针对公开数据集中样本分布不平衡的问题,在模型训练层面优化损失函数提高分类精度.利用公开数据集ISCX VPN-nonVPN进行了广泛的实验,SFAN的总体准确率达到98.49%,F1值为98.03%.实验表明,所提出的加密流量分类方法能够有效识别不同应用程序产生的网络流量. 展开更多
关键词 加密流量分类 混合神经网络 多维度特征融合 注意力机制
在线阅读 下载PDF
结合注意力机制和多尺度特征融合的三维手部姿态估计
15
作者 郭诗月 党建武 +1 位作者 王阳萍 雍玖 《计算机应用》 北大核心 2025年第4期1293-1299,共7页
针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(S... 针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(SEM),以替换沙漏网络(HGNet)中的基本块(Basicblock),在扩大感受野的同时增强对空间信息的敏感性,从而提高手部特征的提取能力;其次,设计一种结合SPCNet(Spatial Preserve and Contentaware Network)和Soft-Attention改进的多尺度信息融合模块SS-MIFM(SPCNet and Soft-attention-Multi-scale Information Fusion Module),在充分考虑空间内容感知机制的情况下,有效地聚合多级特征,并显著提高二维手部关键点检测的准确性;最后,利用2.5D姿态转换模块将二维姿态转换为三维姿态,从而避免二维关键点坐标直接回归计算三维姿态信息导致的空间丢失问题。实验结果表明,在InterHand2.6M数据集上,所提算法的双手关节点平均误差(MPJPE)、单手MPJPE和根节点平均误差(MRRPE)分别达到了12.32、9.96和29.57 mm;在RHD(Rendered Hand pose Dataset)上,与InterNet和QMGR-Net算法相比,所提算法的终点误差(EPE)分别降低了2.68和0.38 mm。以上结果说明了所提算法能够更准确地估计手部姿态,且在一些双手交互和遮挡的场景下有更高的鲁棒性。 展开更多
关键词 手部姿态估计 多尺度特征融合 注意力机制 高分辨率网络 沙漏网络
在线阅读 下载PDF
基于窗口自注意力特征融合的感知图像认证哈希
16
作者 周元鼎 高国鹏 +1 位作者 房耀东 秦川 《计算机研究与发展》 北大核心 2025年第7期1786-1796,共11页
随着多媒体和互联网技术的快速发展,数字图像内容的安全性问题日益突出.为此,提出了一种基于窗口自注意力特征融合的深度感知图像认证哈希方案,该方案能有效检测原始图像的感知内容是否发生变化,并可应用于内容认证、复制检测、篡改识... 随着多媒体和互联网技术的快速发展,数字图像内容的安全性问题日益突出.为此,提出了一种基于窗口自注意力特征融合的深度感知图像认证哈希方案,该方案能有效检测原始图像的感知内容是否发生变化,并可应用于内容认证、复制检测、篡改识别等场合.该方案以卷积神经网络为基础,利用窗口自注意力构建了一个融合图像全局和局部特征的哈希模型.模型首先对主干网络获得的浅层特征进行分块并提取相应的窗口特征,然后计算每个局部特征与全局特征之间的相关性来筛选出最终的局部特征,再将这部分特征和全局特征输入到哈希生成模块中进行融合与压缩,得到最终的图像哈希码.在训练过程中,利用哈希损失和分类损失构造的联合损失函数对模型进行约束,提高感知认证哈希方案的鲁棒性和唯一性.实验结果表明,与现有典型的感知认证哈希方案相比,所提方案可获得更优的图像内容认证性能. 展开更多
关键词 感知哈希 图像认证 窗口自注意力 特征融合 鲁棒性
在线阅读 下载PDF
基于多尺度注意力与特征融合的行人重识别方法研究
17
作者 吴宇森 于宝华 +1 位作者 荣江 张数 《石河子大学学报(自然科学版)》 北大核心 2025年第1期122-132,共11页
行人重识别又称行人再识别,是一种在跨摄像头环境下识别相同行人的技术。目前,由于行人姿势变化、灯光角度、障碍遮挡等问题影响,导致现有方法提取行人特征受到干扰较大,影响识别效果。针对该问题,提出将NFormer嵌入主干网络的不同层级... 行人重识别又称行人再识别,是一种在跨摄像头环境下识别相同行人的技术。目前,由于行人姿势变化、灯光角度、障碍遮挡等问题影响,导致现有方法提取行人特征受到干扰较大,影响识别效果。针对该问题,提出将NFormer嵌入主干网络的不同层级,构建多尺度注意力模块(Multi-Scale Attention-NFormer, MSAN),提取细节丰富的底层特征与表征能力强的高层特征进行融合;提出结合可学习视觉中心与多层感知器,构建了基于可学习视觉中心与多层感知器的特征融合模块(Feature Fusion with Learnable Visual Centers and Multilayer Perceptron, FFLM),提取关联位置信息的局部特征与长距离依赖的全局特征,并将其融合获取更具辨别性的特征表达。为了使主干网络与头部网络更适用于特征融合任务,对ResNet50的激活函数和搭建架构进行改进,保留了更丰富的特征信息;在头部网络添加BN层和GeM池化,缓解了损失函数优化方向不同步的问题。实验结果表明,所提方法在Market-1501和DukeMTMC-reID数据集上的首位命中率分别达到了95.8%、90.2%,平均精度均值为93.0%、84.7%,所提取的特征更具有判别性,识别率更高。 展开更多
关键词 行人重识别 特征融合 多尺度 注意力机制 深度学习
在线阅读 下载PDF
融合注意力机制和加权双向特征网络的皮革包装缺陷检测方法
18
作者 白先浪 张群利 辛志强 《包装工程》 北大核心 2025年第17期232-242,共11页
目的针对皮革包装产品外表面容易出现划伤、褶皱、污渍等现象,传统图像处理方法依赖手工特征提取,难以适应复杂的纹理变化,其检测精度和鲁棒性均受到限制。为此提出一种基于深度学习的融合注意力机制和加权双向特征网络的皮革缺陷检测... 目的针对皮革包装产品外表面容易出现划伤、褶皱、污渍等现象,传统图像处理方法依赖手工特征提取,难以适应复杂的纹理变化,其检测精度和鲁棒性均受到限制。为此提出一种基于深度学习的融合注意力机制和加权双向特征网络的皮革缺陷检测方法。方法以YOLOv5s为基准模型,在其主干网络中引入CA、CBAM注意力机制,以增强模型对关键缺陷特征的关注能力。同时,利用加权双向特征金字塔网络重构其颈部结构,提高特征融合效率。最后,将上述改进方法进行联合集成,以提升检测性能。结果在构建的缺陷皮革数据集上进行训练和测试,结果显示,相较于基准模型,所提方法的Precision值提高了2.73%,Recall值提高了2.68%,mAP@0.5值提高了2.67%,mAP@0.5:0.95值提高了2.63%,F1 score值提高了2.7%。结论该方法缓解了传统目标检测模型在皮革包装缺陷检测任务中存在的预测框定位偏差、漏检和误检等问题,为皮革包装缺陷检测提供了可行的改进方案。 展开更多
关键词 包装产业 皮革缺陷 深度学习 注意力机制 加权双向特征 融合集成
在线阅读 下载PDF
基于残差注意力与特征融合的无参考图像质量评价方法
19
作者 闫嘉阔 司占军 《印刷与数字媒体技术研究》 北大核心 2025年第2期56-64,共9页
目前基于深度学习的无参考图像质量评价方法存在图像语义特征提取不充分或图像语义感知不足等问题。因此,本研究提出了一种改进方法,利用残差注意力和特征融合来进行无参考图像质量评价。首先,使用Resnet-50网络提取图像的低阶特征,然... 目前基于深度学习的无参考图像质量评价方法存在图像语义特征提取不充分或图像语义感知不足等问题。因此,本研究提出了一种改进方法,利用残差注意力和特征融合来进行无参考图像质量评价。首先,使用Resnet-50网络提取图像的低阶特征,然后通过残差双注意力模块增强提取的特征,以有效学习关键信息并更新权重,从而提高对图像特征的关注度并提取高阶特征。使用语义感知网络生成相应的权值参数,通过特征融合模块将不同阶段的高低阶特征进行融合,以丰富高级特征图中不同层级之间的语义和位置信息,并捕捉局部和全局失真。最后,结合全局图像信息和局部图像信息,根据图像内容获取的相应参数,对图像质量进行预测。实验结果表明,本研究提出的方法在预测失真图像质量时能够充分挖掘失真图像的高级语义信息,有效解决真实失真场景下失真图像内容变化和未知失真类型复杂的问题。在复杂的失真情况下,本研究方法仍能准确评价图像质量,并具有较强的泛化能力。 展开更多
关键词 无参考图像质量评价 残差注意力 特征融合 语义感知
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的视频异常检测方法
20
作者 吴祥 肖剑 吉根林 《应用科学学报》 北大核心 2025年第2期234-244,共11页
视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限... 视频画面中的运动物体在不同时刻往往呈现出多样的尺度大小,这给视频异常检测带来了一定的挑战。尽管传统的生成对抗网络在视频异常检测任务上取得了一定成效,但因其采用单一尺度的特征提取方法,无法充分捕获不同尺度物体的特征,从而限制了其异常检测的性能。针对该问题,本文基于生成对抗网络结构,提出了一种基于多尺度特征融合和注意力机制的视频异常检测方法。使用大小不同的卷积核捕获不同感受野的特征,并将它们进行融合以获得多尺度的特征表示。此外,在生成器的转置卷积层后引入坐标注意力机制,自适应分配特征图权重,从而增强模型对关键特征的感知能力。在公开数据集UCSD Ped2和Avenue上的实验结果表明,本文方法的性能优于其他同类方法。 展开更多
关键词 视频异常检测 深度学习 生成对抗网络 多尺度特征融合 注意力机制
在线阅读 下载PDF
上一页 1 2 63 下一页 到第
使用帮助 返回顶部