期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于卷积神经网络的轻量高效图像隐写
1
作者 段新涛 白鹿伟 +4 位作者 徐凯欧 张萌 保梦茹 武银行 秦川 《应用科学学报》 北大核心 2025年第1期80-93,共14页
基于深度学习的图像隐写方法,因存在模型参数量和计算量大等问题,而面临高参数和计算负载的挑战,为此提出了一种轻量高效的图像隐写方法。首先在编码器和解码器中引入Ghost模块,降低了编码器和解码器的参数量和计算量。其次提出了一个... 基于深度学习的图像隐写方法,因存在模型参数量和计算量大等问题,而面临高参数和计算负载的挑战,为此提出了一种轻量高效的图像隐写方法。首先在编码器和解码器中引入Ghost模块,降低了编码器和解码器的参数量和计算量。其次提出了一个多尺度特征融合模块,用以捕捉多维数据中的复杂关系。最后提出了一个新颖的混合损失函数,可在保持模型不变的情况下提升图像隐写质量。实验结果表明,所提方法在256×256像素的图像上峰值信噪比达到47.59 dB。与目前最优的图像隐写方法相比,所提方法的隐写质量提升1.7 dB,参数量减少77%,计算量减少91%,在隐写质量上有较优的表现,同时模型的参数量和计算量大大降低,实现了模型的轻量高效化。 展开更多
关键词 图像隐写 深度学习 多尺度特征融合 混合损失函数
在线阅读 下载PDF
基于多尺度网络与轴向注意力的3D目标检测算法
2
作者 颜承志 陈颖 +1 位作者 钟凯 高寒 《计算机应用》 北大核心 2025年第8期2537-2545,共9页
在3D目标检测中小目标诸如行人和骑行者的检测精确度较低,这是自动驾驶感知系统中存在的挑战性问题。为了准确估计周围环境的状态从而提高行车安全,对Voxel R-CNN(Voxel Region-based Convolutional Neural Network)算法进行改进,提出... 在3D目标检测中小目标诸如行人和骑行者的检测精确度较低,这是自动驾驶感知系统中存在的挑战性问题。为了准确估计周围环境的状态从而提高行车安全,对Voxel R-CNN(Voxel Region-based Convolutional Neural Network)算法进行改进,提出一种基于多尺度网络与轴向注意力的3D目标检测算法。首先,在主干网络中构建多尺度网络和像素级融合模块(PFM)获取更丰富和精准的特征表示,从而增强算法在复杂场景下的鲁棒性和泛化能力;其次,设计适用于具有3D空间维度特征的轴向注意力,并将它应用于感兴趣区域(RoI)的多尺度池化特征,以在有效捕捉局部和全局特征的同时保留3D空间结构中的重要信息,从而提升算法的目标检测和分类的精度和效率;最后,将一种旋转解耦的交并比(RDIoU)方法纳入回归和分类分支,从而使网络学习更精确的边界框,并解决分类和回归之间的对齐问题。在KITTI公开数据集上的实验结果表明,所提算法对行人和骑行者的平均精度均值(mAP)分别达到了62.25%和79.36%,与基准算法Voxel R-CNN相比分别提高了4.02和3.15个百分点,显示出了改进算法在难感知目标检测上的有效性。 展开更多
关键词 3D目标检测 多尺度网络 特征融合 轴向注意力 损失函数
在线阅读 下载PDF
基于融合注意力和多尺度特征的热轧带钢表面缺陷检测方法
3
作者 包广清 周芷意 孟庆成 《北京工业大学学报》 北大核心 2025年第8期944-956,共13页
针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,... 针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,引入遗传算法(genetic algorithm, GA)以获得更具代表性的锚框尺寸,并提升模型的回归速度和小面积缺陷检测的精确度。其次,对于边界模糊且背景复杂的缺陷,提出一种目标检测边界框损失函数FocalSIoU,以减少模型中不必要特征的学习,加快检测速度,提升预测框的回归效果。最后,设计一种多尺度特征融合模块(multi-scale feature fusion module, MFFM),通过多尺度信息融合增强模型特征提取能力,提高小目标的检测精确度,并改善模型检测误检率。在模型Head结构中引入空到深(space to depth, SPD)卷积模块对模型进行改进,避免细粒度信息的丢失,降低目标漏检率。通过NEU-DET数据集进行验证,结果表明,SFSP-YOLOv7模型检测的平均精度均值(mean average precision, mAP)为78.3%,相比原YOLOv7模型提升了5.0个百分点,表明提出的检测方法具有有效性。 展开更多
关键词 带钢表面缺陷检测 深度学习 YOLOv7 损失函数 注意力机制 多尺度特征融合
在线阅读 下载PDF
基于改进残差网络的运动目标模糊图像复原方法 被引量:1
4
作者 孙灵 《现代电子技术》 北大核心 2024年第15期86-90,共5页
传统的残差网络在复原运动目标模糊图像时,在模糊程度较严重的情况下,存在特征提取不充分、噪声干扰等问题,导致恢复出的图像无法完全达到原始图像的清晰度和细节。对此,提出基于改进残差网络的运动目标模糊图像复原方法。对采集到的运... 传统的残差网络在复原运动目标模糊图像时,在模糊程度较严重的情况下,存在特征提取不充分、噪声干扰等问题,导致恢复出的图像无法完全达到原始图像的清晰度和细节。对此,提出基于改进残差网络的运动目标模糊图像复原方法。对采集到的运动目标模糊图像,采用多损失函数融合方法改进传统残差块结构,构建编码器-解码器网络训练结构,训练损失函数,提升网络的特征学习能力。通过完成训练的网络,输出运动目标模糊图像复原结果。实验结果表明,该方法复原运动目标模糊图像的峰值信噪比高于30 dB,结构相似性高于0.9。 展开更多
关键词 改进残差网络 运动目标 多损失函数融合 模糊图像 编辑器-解码器网络 复原方法
在线阅读 下载PDF
多尺度和卷积注意力相结合的红外与可见光图像融合 被引量:2
5
作者 祁艳杰 侯钦河 《红外技术》 CSCD 北大核心 2024年第9期1060-1069,共10页
针对红外与可见光图像融合时,单一尺度特征提取不足、红外目标与可见光纹理细节丢失等问题,提出一种多尺度和卷积注意力相结合的红外与可见光图像融合算法。首先,设计多尺度特征提取模块和可变形卷积注意力模块相结合的编码器网络,多感... 针对红外与可见光图像融合时,单一尺度特征提取不足、红外目标与可见光纹理细节丢失等问题,提出一种多尺度和卷积注意力相结合的红外与可见光图像融合算法。首先,设计多尺度特征提取模块和可变形卷积注意力模块相结合的编码器网络,多感受野提取红外与可见光图像的重要特征信息。然后,采用基于空间和通道双注意力机制的融合策略,进一步融合红外和可见光图像的典型特征。最后,由3层卷积层构成解码器网络,用于重构融合图像。此外,设计基于均方误差、多尺度结构相似度和色彩的混合损失函数约束网络训练,进一步提高融合图像与源图像的相似性。本算法在公开数据集上与7种图像融合算法进行比较,在主观评价和客观评价方面,所提算法相较其它对比算法具有较好的边缘保持性、源图像信息保留度,较高的融合图像质量。 展开更多
关键词 红外与可见光图像 混合损失函数 多尺度特征提取 注意力机制 图像融合
在线阅读 下载PDF
多层特征融合与语义增强的盲图像质量评价 被引量:1
6
作者 赵文清 许丽娇 +1 位作者 陈昊阳 李梦伟 《智能系统学报》 CSCD 北大核心 2024年第1期132-141,共10页
针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信... 针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信息,进而指导失真图像到质量分数的映射过程;考虑预测分数和主观分数之间的相对排名关系,对L_(1)损失函数和三元组排名损失函数进行融合,构建新的损失函数L_(mix)。为了验证本文方法的有效性,在野生图像质量挑战数据集上进行了验证和对比实验,该算法的斯皮尔曼等级相关系数与皮尔逊线性相关系数指标相比原算法分别提升2.3%和2.3%;在康斯坦茨真实图像质量数据数据集和野生图像质量挑战数据集上进行了跨数据集实验,该算法在面对真实失真图像时表现出了良好的泛化性能。 展开更多
关键词 深度学习 图像质量 卷积神经网络 特征提取 通道注意力结构 多层次特征融合 扩张卷积 三元组损失函数
在线阅读 下载PDF
基于多层特征融合的行人检测方法研究 被引量:1
7
作者 黄玲娃 崔文成 邵虹 《计算机科学》 CSCD 北大核心 2024年第S02期479-485,共7页
针对遮挡行人检测识别困难、检测精度低,以及漏检率高等问题,在YOLOv7方法的基础上进行结构优化,提出了一种基于多层特征融合的行人检测网络模型,旨在提高遮挡行人检测的准确性。该方法是在主干网络特征提取部分采用ELAN-C模块,以增强... 针对遮挡行人检测识别困难、检测精度低,以及漏检率高等问题,在YOLOv7方法的基础上进行结构优化,提出了一种基于多层特征融合的行人检测网络模型,旨在提高遮挡行人检测的准确性。该方法是在主干网络特征提取部分采用ELAN-C模块,以增强行人特征信息的提取能力,从而提高行人检测的准确性。同时,在多尺度特征融合部分引入全局注意力机制构成多层特征融合,通过跨维度的信息交互,特别是对位置信息的关注,增强检测目标特征的表征,提高行人检测的准确性。此外,为了加速模型的收敛速度,采用EIoU作为损失函数,进一步提升检测框的定位精度。在公开数据集CityPresons上进行训练验证,模型对数平均漏检率MR-2下降,Bare,Partial,Reasonable,Heavy分别下降0.55%,0.91%,1.78%,1.68%,有效减少了漏检率。 展开更多
关键词 YOLOv7 行人检测 特征提取 多尺度融合 损失函数优化
在线阅读 下载PDF
基于改进YOLOv5的带钢表面缺陷检测 被引量:2
8
作者 杨威 杨俊 许聪源 《计量学报》 CSCD 北大核心 2024年第11期1671-1680,共10页
针对带钢表面缺陷检测方法存在检测精度低和检测速度慢的问题,提出一种基于改进YOLOv5的带钢表面缺陷检测方法。首先,采用内容感知特征重组CARAFE作为多尺度特征融合的上采样算子,构建具有通道缩放的自适应空间特征融合CS-ASFF结构,以... 针对带钢表面缺陷检测方法存在检测精度低和检测速度慢的问题,提出一种基于改进YOLOv5的带钢表面缺陷检测方法。首先,采用内容感知特征重组CARAFE作为多尺度特征融合的上采样算子,构建具有通道缩放的自适应空间特征融合CS-ASFF结构,以增强多尺度特征融合并控制模型复杂度。其次,在模型的卷积层和跨层级结构引入GSConv和VoVGSCSP模块,以减小计算量并提高检测精度。最后,采用Focal-GIOU Loss作为损失函数来解决带钢缺陷图像中难易样本不平衡的问题,并提升模型对复杂数据的适应能力。实验结果表明,在NEU-DET数据集上该方法达到了80.6%的均值平均精度(P_(mAP)),计算量为14.8 GFLOPs。与YOLOv5相比,P_(mAP)提高了4.3%且计算量减少了6.33%。与当前主流目标检测网络相比,在更低的计算量下该方法具有最高的检测精度,能够满足真实工业场景下的带钢表面缺陷实时检测。 展开更多
关键词 机器视觉 带钢表面缺陷检测 YOLOv5 多尺度融合 损失函数
在线阅读 下载PDF
多尺度特征融合的铁轨异物入侵检测研究 被引量:4
9
作者 王楠 侯涛 牛宏侠 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第9期139-153,共15页
针对铁路轨道异物检测中不同尺度异物目标的检测易受复杂环境的影响,导致出现检测精度低及检测速度慢等问题,提出一种多尺度特征融合的铁轨异物检测(RMF-YOLO)算法。首先,设计并引入改进的卷积注意力模块(ICBAM),结合YOLOv7特征提取网络... 针对铁路轨道异物检测中不同尺度异物目标的检测易受复杂环境的影响,导致出现检测精度低及检测速度慢等问题,提出一种多尺度特征融合的铁轨异物检测(RMF-YOLO)算法。首先,设计并引入改进的卷积注意力模块(ICBAM),结合YOLOv7特征提取网络,以增强复杂场景下的特征提取能力。其次,在所有高效层聚合网络模块中采用GhostConv替代普通卷积层,以降低计算复杂度,提高特征输出效率;设计一种改进的加权双向特征金字塔网络N-BiFPN结构,加强多尺度特征融合能力,平衡不同层级特征信息,提高多尺度检测能力。最后,为进一步提升检测精度,采用WIoU损失函数结合动态非单调聚集机制,有效应对低质量锚框产生的梯度,提高模型对不同尺度异物检测的整体性能。实验结果表明:在自制的铁轨异物数据集上,RMF-YOLO算法减少了原网络模型的参数量,有效提升了模型的检测精度与检测速度,改善了漏检与误检问题,平均精度提升了5.5%,检测速度提升了5.88%,计算量减少了12.25%,能满足铁轨入侵异物检测中对检测精度和实时性的需求。 展开更多
关键词 铁轨异物检测 特征融合 多尺度 YOLOv7 损失函数
在线阅读 下载PDF
面向复杂场景密集行人检测的YOLOv8改进模型 被引量:1
10
作者 胡伟超 皮建勇 +2 位作者 胡倩 黄昆 王娟敏 《电子测量技术》 北大核心 2024年第14期159-169,共11页
针对当前行人检测面临的环境复杂、目标尺寸多变和严重遮挡等挑战,导致现有检测技术在识别密集行人时容易发生误判和遗漏的问题,本文提出一种高效的面向复杂场景密集行人检测的YOLOv8改进模型。在骨干网络引入DCNv2设计C2f_DCNetv2替换... 针对当前行人检测面临的环境复杂、目标尺寸多变和严重遮挡等挑战,导致现有检测技术在识别密集行人时容易发生误判和遗漏的问题,本文提出一种高效的面向复杂场景密集行人检测的YOLOv8改进模型。在骨干网络引入DCNv2设计C2f_DCNetv2替换C2f模块,提升骨干网络的特征提取能力;通过在架构中加入小目标检测头,增强模型对小尺寸目标的检测能力,提高对小目标的检测识别精度;基于四检测头改进AFPN设计出AFPN-4H,优化特征层之间的信息融合,提高了模型对不同尺度目标的适应性和检测精度;最后,通过结合Wise-IoU、Focaler-IoU和MPDIoU得到WFM-IoU,进一步提高了目标定位的准确性。实验结果表明,与原始的YOLOv8n模型相比,在P、R、AP50以及AP50:95等关键指标上分别提升1.6%、4.0%、3.6%和3.8%,也优于其他算法。验证了本文改进算法在复杂场景密集行人检测任务中具有较好的性能。 展开更多
关键词 密集行人检测 YOLOv8 可变形卷积 多尺度特征融合 损失函数
在线阅读 下载PDF
基于改进ConvMixer和动态焦点损失的视听情感识别 被引量:2
11
作者 师硕 覃嘉俊 +1 位作者 于洋 郝小可 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2824-2835,共12页
视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和... 视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和动态权重焦点损失函数的视听情感识别方法.采用空间和时间邻接矩阵代替ConvMixer中的深度分离卷积,提取视频时域空域上的全局和局部特征.提出跨模态时间注意力模块,以对称结构捕捉模态间的时间相关性,提高特征融合效果.结合混淆矩阵计算具有动态权重的焦点损失函数,差异化地加大错分样本在损失中的占比,优化模型参数.在公开数据集上的实验结果表明,本文方法能提取到代表性特征,可有效优化网络结构,提高了情感识别的准确率. 展开更多
关键词 情感识别 ConvMixer 注意力机制 多模态特征融合 焦点损失函数
在线阅读 下载PDF
MSViT:融合多尺度特征的轻量化图像分类混合模型
12
作者 覃晓 彭磊 +6 位作者 廖惠仙 元昌安 赵剑波 邓超 钱泉梅 卢虹妃 龚远旭 《广西科学》 北大核心 2024年第5期912-924,共13页
针对现有Vision Transformer (ViT)模型在局部特征捕捉和多尺度特征融合方面的局限性,本文提出一种新型的融合多尺度特征的轻量化图像分类混合模型(Multi-Scale Vision Transformer, MSViT)。首先,在编码器中设计捕获通道特征的多尺度... 针对现有Vision Transformer (ViT)模型在局部特征捕捉和多尺度特征融合方面的局限性,本文提出一种新型的融合多尺度特征的轻量化图像分类混合模型(Multi-Scale Vision Transformer, MSViT)。首先,在编码器中设计捕获通道特征的多尺度前馈神经网络(Multi-Scale Feed Forward Network, MSFFN)模块,该模块能有效提取空间和多尺度通道特征。其次,设计一个新的级联特征融合解码器(Cascade Feature Fusion Decoder, CFFD),通过整合特征金字塔网络(Feature Pyramid Network, FPN)和多阶段特征融合解码器,显著提升模型对不同尺度特征的交互和融合能力。最后,模型引入多阶损失函数,以全面优化不同尺度特征在图像分类任务中的表现。为了验证MSViT的有效性,在4个实验数据集[ImageNet-1k的1个子集(Small_ImageNet)、Cifar 100、糖尿病视网膜病变数据集(APTOS 2019)、蘑菇数据集(Mushroom 66)]上进行大量的实验。其中在Small_ImageNet数据集上的实验结果显示,MSViT实现了87.58%的Top-1准确率,较EdgeViT-XXS提升了2.27%。实验结果证明了MSViT在图像分类任务中的有效性。 展开更多
关键词 图像分类 多尺度特征融合 多阶损失函数 特征金字塔网络(FPN) TRANSFORMER
在线阅读 下载PDF
基于注意力机制与多尺度特征融合的行人重识别方法 被引量:14
13
作者 宋晓茹 杨佳 +2 位作者 高嵩 陈超波 宋爽 《科学技术与工程》 北大核心 2022年第4期1526-1533,共8页
针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法。首先使用改进的骨干网络R-ResNet50提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制DANet... 针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法。首先使用改进的骨干网络R-ResNet50提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制DANet,使模型更关注于重点信息;最后,对提取出的关键特征进行多尺度特征融合,实现特征间的优势互补,并使用联合交叉熵损失、难样本采样三元组损失和中心损失的多损失函数策略对网络模型进行训练。实验结果表明,所提方法在Market1501、DukeMTMC-ReID数据集上的首位命中率Rank-1和平均精度均值mAP分别达到了92.7%、80.4%和86.4%、71.0%,模型提取的特征更具有判别性,识别率更高。 展开更多
关键词 行人重识别 注意力机制 多尺度特征融合 多损失函数策略
在线阅读 下载PDF
多模态融合的深度学习脑肿瘤检测方法 被引量:3
14
作者 姚红革 沈新霞 +2 位作者 李宇 喻钧 雷松泽 《光子学报》 EI CAS CSCD 北大核心 2019年第7期159-170,共12页
针对目前传统方法脑肿瘤检测准确率低的问题,提出一种基于深度学习的三维脑肿瘤检测方法.首先将不同模态的脑肿瘤磁共振成像影像进行融合,获取不同模态下的脑肿瘤病灶三维空间特征;然后在卷积层和池化层之间增加实列归一化层,提高网络... 针对目前传统方法脑肿瘤检测准确率低的问题,提出一种基于深度学习的三维脑肿瘤检测方法.首先将不同模态的脑肿瘤磁共振成像影像进行融合,获取不同模态下的脑肿瘤病灶三维空间特征;然后在卷积层和池化层之间增加实列归一化层,提高网络的收敛速度,缓解过拟合的问题;并对损失函数进行改进,采用加权损失函数加强对病灶区域的特征学习;最后结合后处理方法解决假阳脑肿瘤病灶多的问题.实验结果表明:提出的脑肿瘤检测方法可有效进行肿瘤病灶定位;相关性系数、敏感性和特异性三种评价指标分别达到了0.9267、0.9281和0.9977,与二维检测网络相比,提高了4.6%、3.96%和0.04%,较初始的单模态脑肿瘤检测方法提升了13.2%、10.42%和0.12%. 展开更多
关键词 磁共振 脑肿瘤检测 多模态融合 实列归一化 加权损失函数
在线阅读 下载PDF
加权特征融合的密集连接网络人脸识别算法 被引量:9
15
作者 王小玉 韩昌林 胡鑫豪 《计算机科学与探索》 CSCD 北大核心 2019年第7期1195-1205,共11页
在非约束条件下人脸识别常受到表情变化、视角偏差、不同程度的遮挡和曝光等各种综合因素的影响;并且深度卷积神经网络几乎都存在参数过多,训练时梯度扩散或消失等问题。针对上述问题,提出了FuseNet网络模型。该模型有效地利用了人的眼... 在非约束条件下人脸识别常受到表情变化、视角偏差、不同程度的遮挡和曝光等各种综合因素的影响;并且深度卷积神经网络几乎都存在参数过多,训练时梯度扩散或消失等问题。针对上述问题,提出了FuseNet网络模型。该模型有效地利用了人的眼睛、鼻子、嘴巴等局部特征信息,同时又包含面部轮廓等全局特征信息,并提出了多损失函数进一步缩小类内特征差距和扩大类间特征距离,有效地增强了非约束条件下人脸识别的鲁棒性。通过使用加权密集连接卷积神经网络来提取人脸的全局特征,密集连接模块可有效地解决深层网络所引起的参数冗余以及梯度扩散等问题。不同的连接权值使得网络能够充分地利用各部分特征。实验结果表明,无论是在闭集的CASIA-WebFace数据集上,还是开集的FLW数据集、MegaFace数据集上,提出的FuseNet网络都具有较好的识别率和泛化能力。 展开更多
关键词 人脸识别 加权密集连接 加权特征融合 多损失函数
在线阅读 下载PDF
基于改进生成对抗网络的多聚焦图像融合 被引量:4
16
作者 王娟 柯聪 +3 位作者 刘敏 蔡霖康 石豪 袁旭亮 《科学技术与工程》 北大核心 2020年第25期10308-10312,共5页
针对多聚焦图像融合中权重分配和融合规则设计困难的问题,提出了一种基于改进生成对抗网络的多聚焦图像融合算法。首先,对生成器网络和判别器网络进行设计,为了避免图像在网络模型传递过程中造成的信息丢失,裁撤网络结构中的池化层,通... 针对多聚焦图像融合中权重分配和融合规则设计困难的问题,提出了一种基于改进生成对抗网络的多聚焦图像融合算法。首先,对生成器网络和判别器网络进行设计,为了避免图像在网络模型传递过程中造成的信息丢失,裁撤网络结构中的池化层,通过卷积层叠提取图像特征。其次,构建生成对抗网络的损失函数,优化网络参数,得到最佳的网络模型。最后,将实验结果与现有的几种融合算法相比较,通过5种客观评价指标来评价融合图像的效果。结果表明,提出的算法不仅在主观上有着良好的视觉效果,也在客观评价指标上有显著优势。 展开更多
关键词 多聚焦图像融合 生成对抗网络 损失函数 网络模型
在线阅读 下载PDF
基于生成对抗网络的多聚焦图像融合 被引量:5
17
作者 蒋留兵 张点 +2 位作者 潘波 郑朋 车俐 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第11期1715-1725,共11页
多聚焦图像融合能够融合同一场景下具有不同聚焦部分的一系列图像.为了克服多聚焦图像融合模糊特征提取中存在的不足,提出一种基于U-Net的生成对抗网络模型.首先,生成器采用U-Net和SSE对多聚焦图像的特征进行提取,并完成图像融合;其次,... 多聚焦图像融合能够融合同一场景下具有不同聚焦部分的一系列图像.为了克服多聚焦图像融合模糊特征提取中存在的不足,提出一种基于U-Net的生成对抗网络模型.首先,生成器采用U-Net和SSE对多聚焦图像的特征进行提取,并完成图像融合;其次,判别器采用卷积层对已知的融合结果和生成器生成的融合图像进行分辨;然后,损失函数采用生成器的对抗损失、映射损失、梯度损失、均方误差损失和判别器对抗损失对生成网络进行参数调节;最后,将生成器、判别器和损失函数组成生成对抗网络模型,并进行实验.Pascal VOC2012数据集作为生成对抗网络的训练集,包括近焦图像、远焦图像、映射图像和融合图像.实验结果证明,该生成对抗网络模型能够有效地提取多聚焦图像中的模糊特征,且融合图像在互信息、相位一致性和感知相似性等方面表现优异. 展开更多
关键词 多聚焦图像融合 U-Net 生成对抗网络 损失函数
在线阅读 下载PDF
复杂场景下自适应特征融合的多尺度船舶检测 被引量:6
18
作者 罗芳 刘阳 何道森 《计算机应用》 CSCD 北大核心 2023年第11期3587-3593,共7页
受台风、大雾、雨雪等复杂天气以及遮挡、尺度变化等影响,现有船舶检测方法存在误检和漏检问题。针对上述复杂场景问题,在YOLOX-S模型的基础上,提出一种自适应特征融合的多尺度船舶检测方法。首先,在主干特征提取网络中引入特征增强模块... 受台风、大雾、雨雪等复杂天气以及遮挡、尺度变化等影响,现有船舶检测方法存在误检和漏检问题。针对上述复杂场景问题,在YOLOX-S模型的基础上,提出一种自适应特征融合的多尺度船舶检测方法。首先,在主干特征提取网络中引入特征增强模块,抑制复杂背景噪声对船舶特征提取的干扰;其次,考虑深浅层次特征融合比例问题,设计自适应特征融合模块,充分利用深浅层次特征,提高模型的多尺度船舶检测能力;最后,在检测头网络,将检测头解耦,并引入自适应的多任务损失函数,平衡分类任务和回归任务,提高船舶检测的鲁棒性。实验结果显示,所提方法在公开船舶检测数据集SeaShips和McShips上的检测平均精度均值(mAP)分别达到了97.43%和96.10%,检测速度达到每秒189帧,满足实时检测的要求,验证了所提方法在复杂场景下仍能对多尺度船舶目标实现高精度检测。 展开更多
关键词 多尺度船舶检测 YOLOX 自适应特征融合 特征增强 多任务损失函数
在线阅读 下载PDF
多特征融合的端到端链式行人多目标跟踪网络 被引量:4
19
作者 周海赟 项学智 +1 位作者 王馨遥 任文凯 《计算机工程》 CAS CSCD 北大核心 2022年第9期305-313,共9页
目标检测、特征提取与数据关联作为多目标跟踪网络中重要的组件,独立或部分联合地发挥作用,这种组件分离的方法虽取得了良好的跟踪效果,但增加了跟踪网络的复杂性,影响了跟踪速度。为提升行人多目标跟踪速度及维持跟踪精度,提出一种端... 目标检测、特征提取与数据关联作为多目标跟踪网络中重要的组件,独立或部分联合地发挥作用,这种组件分离的方法虽取得了良好的跟踪效果,但增加了跟踪网络的复杂性,影响了跟踪速度。为提升行人多目标跟踪速度及维持跟踪精度,提出一种端到端链式行人多目标跟踪网络。将目标检测、特征提取与数据关联集成到一个统一的框架中,将连续2帧图片组成一个节点作为输入,直接回归出节点之间相同目标的成对边界框,利用相邻节点之间公共帧的强相似性,仅使用交并比匹配进行数据关联,以提高跟踪速度。使用多特征融合的双向特征金字塔,并在金字塔网络中引用改进可变形卷积,提高模型对目标形变的适应性。为解决正负样本不平衡及梯度贡献的差异,将focal loss与BalancedL1 Loss组成多任务学习损失函数以促进网络的均衡学习。在MOT17数据集上的实验结果表明,与DeepSORT、TubeTK、CenterTrack等网络相比,该网络可有效实现跟踪速度与精度的平衡,多目标跟踪精度为69.6,跟踪速度保持为21.6 frame/s。 展开更多
关键词 多目标跟踪 链式跟踪 多特征融合 特征金字塔 多任务损失函数
在线阅读 下载PDF
深度度量学习视频指纹算法 被引量:1
20
作者 李新伟 徐良浩 +1 位作者 杨艺 费树岷 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2020年第9期1411-1419,共9页
在满足鲁棒性、独特性前提下,为了提高视频指纹系统紧凑性,提出一种端到端的深度度量学习视频指纹算法.网络整体框架由权值共享的三分支网络组成,分支网络采用改进的3D残差网络将多层特征融合并进行压缩,实现视频数据到指纹的端到端映射... 在满足鲁棒性、独特性前提下,为了提高视频指纹系统紧凑性,提出一种端到端的深度度量学习视频指纹算法.网络整体框架由权值共享的三分支网络组成,分支网络采用改进的3D残差网络将多层特征融合并进行压缩,实现视频数据到指纹的端到端映射.网络目标函数由度量和分类双损失函数组成,其中,设计的边界约束三元组角度度量损失函数克服了普通三元组损失函数对特征相关性表达不足的问题;分类损失函数弥补了度量损失对样本特征整体分布不敏感的问题.在公开数据集FCVID上对文中算法、传统方法和深度方法进行了大量实验.结果表明,深度度量学习视频指纹算法在鲁棒性、独特性提高的同时紧凑性显著提高. 展开更多
关键词 深度度量学习 多层特征融合 端到端 双损失函数
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部