期刊文献+
共找到184篇文章
< 1 2 10 >
每页显示 20 50 100
基于自编码器GAN数据增强的工业小目标缺陷检测 被引量:2
1
作者 周思聪 向峰 +1 位作者 李红军 左颖 《现代制造工程》 北大核心 2025年第2期101-108,共8页
工业缺陷图像样本是工业产品缺陷检测、分类和分级的基础数据。针对工业缺陷检测目前仍存在复杂环境下的目标检测困难、样本数量不足导致特征提取差等问题,提出了一种预训练的自编码器生成对抗网络。用预训练的自编码器代替基础生成对... 工业缺陷图像样本是工业产品缺陷检测、分类和分级的基础数据。针对工业缺陷检测目前仍存在复杂环境下的目标检测困难、样本数量不足导致特征提取差等问题,提出了一种预训练的自编码器生成对抗网络。用预训练的自编码器代替基础生成对抗网络(GAN)的生成网络,引导生成网络更好地融合数据特征。结合目标图像的特征重新设计一个编码器-解码器损失函数来替换GAN的对抗损失函数。利用钢卷端面缺陷数据集进行试验。试验结果表明,经过改进GAN数据增强后,平均精度均值mAP0.5最高提升了0.118,对单类缺陷的检测准确率最高提升了0.138。 展开更多
关键词 生成对抗网络 工业图像生成 预训练自编码器 缺陷检测
在线阅读 下载PDF
融合门控变换机制和GAN的低光照图像增强方法 被引量:5
2
作者 何银银 胡静 +1 位作者 陈志泊 张荣国 《计算机工程》 CAS CSCD 北大核心 2024年第2期247-255,共9页
针对低光照图像增强过程中存在的配对图像数据依赖、细节损失严重和噪声放大问题,提出结合门控通道变换机制和生成对抗网络(GAN)的低光照图像增强方法AGR-GAN,该方法可以在没有低/正常光图像对的情况下进行训练。首先,设计特征提取网络... 针对低光照图像增强过程中存在的配对图像数据依赖、细节损失严重和噪声放大问题,提出结合门控通道变换机制和生成对抗网络(GAN)的低光照图像增强方法AGR-GAN,该方法可以在没有低/正常光图像对的情况下进行训练。首先,设计特征提取网络,该网络由多个基于门控通道变换单元的多尺度卷积残差模块构成,以提取输入图像的全局上下文特征和多尺度局部特征信息;然后,在特征融合网络中,采用卷积残差结构将提取的深浅层特征进行充分融合,再引入横向跳跃连接结构,最大程度保留细节特征信息,获得最终的增强图像;最后,引入联合损失函数指导网络训练过程,抑制图像噪声,使增强图像色彩更自然匀称。实验结果表明,该方法在主观视觉分析和客观指标评价方面相较其他算法均具有显著优势,其能有效提高低光照图像的亮度和对比度,减弱图像噪声,增强后的图像更清晰且色彩更真实,峰值信噪比、结构相似度和无参考图像质量评价指标平均可达16.48 dB、0.93和3.37。 展开更多
关键词 低光照图像增强 卷积残差结构 门控通道变换单元 无监督学习 生成对抗网络
在线阅读 下载PDF
基于高光谱成像和GAN-SA-UNet算法的烟叶叶脉分割方法研究
3
作者 付主木 郝英杰 +3 位作者 李嘉康 雷翔 堵劲松 徐大勇 《农业机械学报》 EI CAS CSCD 北大核心 2024年第11期193-201,共9页
叶脉作为植物的重要特征,包含生理和遗传信息,针对复杂叶面纹理状态下的细小叶脉边缘分割模糊、分割精度低等问题,以烟叶为研究对象,提出了一种GAN-SA-UNet叶脉分割算法。通过高光谱成像技术获取叶脉与叶面光谱信息,并利用主成分分析(Pr... 叶脉作为植物的重要特征,包含生理和遗传信息,针对复杂叶面纹理状态下的细小叶脉边缘分割模糊、分割精度低等问题,以烟叶为研究对象,提出了一种GAN-SA-UNet叶脉分割算法。通过高光谱成像技术获取叶脉与叶面光谱信息,并利用主成分分析(Principal component analysis,PC A)对其进行降维,得到合成图。在此基础上,引入空间注意力机制,捕捉关键的空间特征,提高分割精度,同时引入对抗网络,优化生成结果,提高叶脉分割的鲁棒性。结果表明:叶脉与叶面光谱PCA前3个主成分解释率达到95.71%,二者降维后的光谱特征表现出明显的可分性,前3个主成分合成图能够凸显叶面与叶脉之间的差异,突出叶脉特征。GAN-SA-UNet分割算法能够捕捉复杂叶面纹理图像的脉络特征,分割准确率和交并比分别达98.93%和66.23%,与原模型相比,分别提高0.18个百分点和4.21个百分点,单幅图像推理时间为4 ms。在对不同产地、部位、等级、类型烟叶验证测试中表现出较强的泛化能力和高效准确的识别能力。 展开更多
关键词 烟叶叶脉分割 高光谱成像技术 U-Net 空间注意力机制 生成对抗网络
在线阅读 下载PDF
基于GAN反演的无缝图像补全技术 被引量:1
4
作者 喻永生 罗铁坚 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2024年第5期705-714,共10页
图像补全技术广泛应用于对象消除、媒体编辑,旨在平滑地恢复受损图像。基于生成对抗网络(GAN)反演将预训练的GAN模型作为有效先验,以真实的合成材质填充缺失区域。然而,现有GAN反演方法忽视了图像补全是具有硬约束的生成任务,使拼接图... 图像补全技术广泛应用于对象消除、媒体编辑,旨在平滑地恢复受损图像。基于生成对抗网络(GAN)反演将预训练的GAN模型作为有效先验,以真实的合成材质填充缺失区域。然而,现有GAN反演方法忽视了图像补全是具有硬约束的生成任务,使拼接图像有颜色、语义的不连续问题。针对此问题设计新的双向感知生成器和预调制网络来无缝地补全图像,其中双向感知生成器充分利用扩展隐藏空间,帮助模型从数据表征层面感知输入图像的非缺失区域,预调制网络利用多尺度结构进一步为风格向量提供判别性更强的语义。在Places2和CelebA-HQ数据集上进行实验,结果表明该方法不仅搭建GAN反演和图像补全之间的桥梁,而且优于目前主流算法,在FID指标上降低49.2%。 展开更多
关键词 图像补全 生成对抗网络 gan反演 深度学习 对象消除
在线阅读 下载PDF
基于GAN改进的红外光与可见光图像融合算法研究
5
作者 鲁晓涵 李洋 +2 位作者 贾耀东 邰昱博 徐宇 《电光与控制》 CSCD 北大核心 2024年第6期42-46,73,共6页
针对夜晚户外场景下,传统的单一鉴别器生成对抗网络(GAN)容易忽略红外光的亮度信息和边缘信息的问题,提出一种基于注意力机制与双鉴别器的红外光与可见光图像融合算法。首先,为了有针对性地获得红外光图像的目标信息和可见光图像的背景... 针对夜晚户外场景下,传统的单一鉴别器生成对抗网络(GAN)容易忽略红外光的亮度信息和边缘信息的问题,提出一种基于注意力机制与双鉴别器的红外光与可见光图像融合算法。首先,为了有针对性地获得红外光图像的目标信息和可见光图像的背景纹理信息,在生成器网络中引入通道注意力机制;其次,使用双鉴别器的生成对抗网络,并设计一种新的鉴别器输入,在提高训练稳定性的同时更好地保留源图像信息;最后,损失函数设置为对抗损失、结构相似性损失和梯度损失,以约束鉴别器使其生成细节信息丰富的融合图像。在TNO数据集上的实验结果表明,所提算法得到的融合图像梯度变化更明显、边缘更加清晰,更符合人眼视觉效果。 展开更多
关键词 图像融合 红外光与可见光图像 生成对抗网络 注意力机制
在线阅读 下载PDF
对比学习改进文本生成图像方法的研究
6
作者 赵宏 王贺 李文改 《计算机工程与应用》 北大核心 2025年第14期264-273,共10页
针对现有文本生成图像方法中仅依赖图像和文本之间的语义相似度损失为约束,模型难以有效学习到图像与对应多个文本之间的关系,导致生成图像和文本之间语义匹配度低的问题,提出一种引入对比学习对文本生成图像模型改进的方法。在训练阶段... 针对现有文本生成图像方法中仅依赖图像和文本之间的语义相似度损失为约束,模型难以有效学习到图像与对应多个文本之间的关系,导致生成图像和文本之间语义匹配度低的问题,提出一种引入对比学习对文本生成图像模型改进的方法。在训练阶段,采用对比学习的方法,计算同一图像的不同文本生成图像之间的对比损失,使模型能够学习同一图像的不同文本表示,以提高生成图像和文本语义的一致性。同时,计算生成图像与真实图像之间的对比损失,保证生成图像向真实图像靠拢。在生成器中,设计一种新的特征融合模块,通过注意力图作为条件,引导图像特征与文本特征对齐,从而提高生成图像的细节表达。实验结果表明,与基准模型相比,在CUB数据集上的Inception Score分数提高了7.32%,Fréchet Inception Distance分数下降了21.06%;在COCO数据集上的Fréchet In-ception Distance分数下降了36.43%。证明该方法生成的图像具有更好的文本语义一致性和真实性。 展开更多
关键词 文本生成图像 生成对抗网络(gan) 对比学习 特征融合 语义一致性
在线阅读 下载PDF
基于分频式生成对抗网络的非成对水下图像增强
7
作者 牛玉贞 张凌昕 +2 位作者 兰杰 许瑞 柯逍 《电子学报》 北大核心 2025年第2期527-544,共18页
增强水下图像质量对水下作业领域的发展具有重要意义.现有的水下图像增强方法通常基于成对的水下图像和参考图像进行训练,然而实际获取与水下图像对应的参考图像比较困难,相比之下获得非成对高质量水下图像或者陆上图像较为容易.此外,... 增强水下图像质量对水下作业领域的发展具有重要意义.现有的水下图像增强方法通常基于成对的水下图像和参考图像进行训练,然而实际获取与水下图像对应的参考图像比较困难,相比之下获得非成对高质量水下图像或者陆上图像较为容易.此外,现有的水下图像增强方法很难同时针对各种失真类型进行图像增强.为了避免对成对训练数据的依赖和进一步降低获得训练数据的难度,并应对多样的水下图像失真类型,本文提出了一种基于分频式生成对抗网络(Frequency-Decomposed Generative Adversarial Network,FD-GAN)的非成对水下图像增强方法,并在此基础上设计了高低频双分支生成器用于重建高质量水下增强图像.具体来说,本文引入特征级别的小波变换将特征分为低频和高频部分,并基于循环一致性生成对抗网络对低频和高频部分区分处理.其中,低频分支采用结合低频注意力机制的编码-解码器结构实现对图像颜色和亮度的增强,高频分支则采用并行的高频注意力机制对各高频分量进行增强,从而实现对图像细节的恢复.在多个标准水下图像数据集上的实验结果表明,本文提出的方法在使用非成对的高质量水下图像和引入部分陆上图像的情况下,均能有效生成高质量的水下增强图像,且有效性和泛化性均优于当前主流的水下图像增强方法. 展开更多
关键词 水下图像增强 生成对抗网络 小波变换 注意力机制 高低频双分支生成器
在线阅读 下载PDF
基于全局一致的非配对低照度图像增强方法
8
作者 江泽涛 黄钦阳 +3 位作者 张惠鹃 金鑫 黄景帆 廖培期 《计算机研究与发展》 北大核心 2025年第4期876-887,共12页
由于低照度配对图像的制作成本昂贵且难于制作,而非配对低照度图像增强方法不依赖配对图像数据因而更有实用价值,但其缺乏详细的监督信号导致输出图像存在全局曝光不一致、色彩失真和大量噪声等视觉退化问题,在实际应用中存在挑战.为了... 由于低照度配对图像的制作成本昂贵且难于制作,而非配对低照度图像增强方法不依赖配对图像数据因而更有实用价值,但其缺乏详细的监督信号导致输出图像存在全局曝光不一致、色彩失真和大量噪声等视觉退化问题,在实际应用中存在挑战.为了更好地满足实用需求,提出一种基于全局一致的非配对低照度增强方法(unpaired low-light enhancement method based on global consistency,GCLLE).首先,该方法通过全局一致性保持模块(global consistency preserving module,GCPM)将编码器和解码器中相同尺度的特征重新建模并融合以矫正不同尺度的上下文信息,保证输出图像全局曝光调整一致性和全局结构一致性,使得图像亮度分布均匀并避免扭曲和失真;利用局部平滑和调制模块(local smoothing and modulation module,LSMM)学习一组局部的低阶曲线映射,为图像提供更宽的动态范围并进一步提高质量,实现真实和自然的增强效果;提出使用双路池化融合深层特征的深度特征强化模块(deep feature enhancement module,DFEM)压缩无关信息并突出更有区分度的编码特征,减少了不准确信息并使得解码器更容易捕获图像中的低强度信号,保留图像更多细节.不同于关注配对图像像素间一对一映射关系的配对增强方法,GCLLE通过缩小低照度图像与非配对正常照度图像之间的风格差异实现增强.在MIT和LSRW数据集上进行大量的实验,结果表明所提方法在多个客观指标上超过了现有典型低照度增强方法,具有更好的增强效果. 展开更多
关键词 低照度图像 图像增强 非配对学习 生成对抗网络 深度学习
在线阅读 下载PDF
结合信噪比引导的双分支结构和直方图均衡的低照度图像增强网络
9
作者 黄颖 高胜美 +1 位作者 陈广 刘苏 《计算机应用》 北大核心 2025年第6期1971-1979,共9页
针对基于深度学习的低照度图像增强(LLIE)技术普遍依赖成对的数据集进行训练的问题,考虑实际应用中配对数据集的获取难度较高及其可能导致网络的泛化能力受限的问题,提出一种结合信噪比(SNR)引导的双分支结构和直方图均衡(HE)的LLIE网络... 针对基于深度学习的低照度图像增强(LLIE)技术普遍依赖成对的数据集进行训练的问题,考虑实际应用中配对数据集的获取难度较高及其可能导致网络的泛化能力受限的问题,提出一种结合信噪比(SNR)引导的双分支结构和直方图均衡(HE)的LLIE网络,从而摆脱对配对数据集的依赖。首先,在生成对抗网络(GAN)的框架上,引入卷积神经网络(CNN)和Transformer的双分支结构,并使用SNR图像指导网络自适应地增强图像的不同区域,以有效平衡图像增强和噪声抑制;其次,采用经HE处理的低照度图像约束生成结果,从而显著提升生成图像的纹理细节;最后,在鉴别器部分,结合全局与局部鉴别器确保生成图像与参考图像在分布上的一致性,进一步提高图像的视觉质量。为了验证所提网络的有效性,在LOL与LSRW测试集上进行测试,与包含监督和无监督的10种先进方法进行比较。实验结果表明,在LOL数据集上,所提网络的峰值信噪比(PSNR)为19.15 dB,结构相似性指数(SSIM)为0.7051,均位列第2名;在LSRW数据集中,所提网络以17.28 dB的PSNR和0.4857的SSIM分别获得第1名与第2名;具体地,在LSRW数据集上,所提网络的PSNR相较于KinD(Kindling the Darkness)和EnlightenGAN(deep light Enhancement without paired supervision Generative Adversarial Network)方法分别提升了15.7%和9.6%。可见,所提网络与无监督方法和部分有监督方法相比均展现了更优越的性能,且显著提升了生成图像的质量。 展开更多
关键词 低照度图像增强 无监督学习 生成对抗网络 直方图均衡 特征融合
在线阅读 下载PDF
极低比特率图像压缩技术综述 被引量:1
10
作者 岳爽 陈喆 殷福亮 《数据采集与处理》 北大核心 2025年第1期102-116,共15页
图像是人们获取信息的重要途径之一。随着图像传输与存储需求的不断增加,尤其在带宽受限或云存储情况下,对图像进行极低比特率压缩,对于提高传输效率和节省存储空间具有重要意义。基于此,本文对有损图像极低比特率压缩技术进行了系统综... 图像是人们获取信息的重要途径之一。随着图像传输与存储需求的不断增加,尤其在带宽受限或云存储情况下,对图像进行极低比特率压缩,对于提高传输效率和节省存储空间具有重要意义。基于此,本文对有损图像极低比特率压缩技术进行了系统综述。首先,在基于生成对抗网络(Generative adversarial networks,GAN)的图像压缩衍生算法在高分辨率图像压缩、生成图像模糊、忽视语义信息与纹理信息等方面问题的基础上,介绍了最新的极低比特率图像压缩方法。然后,阐述了分层压缩、基于对象和感兴趣区域等其他非GAN模型的极低比特率图像压缩方法。接着,描述了常用数据集及有损压缩条件下的图像质量评价方法。最后,对极低比特率有损图像压缩技术做出总结,并对其后续的发展进行了展望。 展开更多
关键词 图像压缩 极低比特率 图像有损编码 深度学习 生成对抗网络
在线阅读 下载PDF
扩散模型在计算机视觉领域的研究现状 被引量:1
11
作者 管凤旭 张涵宇 +3 位作者 路斯棋 赖海涛 杜雪 郑岩 《智能系统学报》 北大核心 2025年第2期265-282,共18页
扩散模型是受分子热力学启发而来的一类新的生成模型,具有训练稳定、对模型设置依赖性弱等优点。近年来,扩散模型被广泛应用于各项任务,并且取得了相比于以往生成模型更多样、更高质量的结果。目前,扩散模型已成为计算机视觉领域热门的... 扩散模型是受分子热力学启发而来的一类新的生成模型,具有训练稳定、对模型设置依赖性弱等优点。近年来,扩散模型被广泛应用于各项任务,并且取得了相比于以往生成模型更多样、更高质量的结果。目前,扩散模型已成为计算机视觉领域热门的基准方法。为更好地促进扩散模型在计算机视觉领域的发展,对扩散模型进行综述:首先对比了扩散模型与其他生成模型的优劣,介绍了扩散模型的数学原理;随后,从扩散模型存在的普遍问题出发,介绍了相关学者近年来所做的改进工作,以及扩散模型在多种视觉任务上的应用实例;最后,探讨了扩散模型存在的问题,并提出了一些未来可能的发展趋势。 展开更多
关键词 扩散模型 去噪扩散概率模型 分数扩散模型 深度学习 计算机视觉 图像生成 生成模型 生成对抗网络
在线阅读 下载PDF
基于生成对抗网络的人脸属性合成技术综述 被引量:1
12
作者 王健强 张珂 李培杰 《计算机应用研究》 北大核心 2025年第3期650-662,共13页
人脸属性合成技术旨在保留人脸面部图像身份信息的情况下,根据指定目标重建人脸属性,从而在源图像上合成具有全新属性的人脸。计算机视觉技术的发展为人脸属性合成技术提供了全新的解决方案。为此,从人脸属性合成数据集、传统和生成对... 人脸属性合成技术旨在保留人脸面部图像身份信息的情况下,根据指定目标重建人脸属性,从而在源图像上合成具有全新属性的人脸。计算机视觉技术的发展为人脸属性合成技术提供了全新的解决方案。为此,从人脸属性合成数据集、传统和生成对抗网络(GAN)的合成网络以及人脸语义方面综述了人脸属性合成技术的发展。首先分析了人脸属性合成领域中传统方法和主流的深度学习方法,探讨基于GAN方法的发展现状,将基于GAN的人脸属性合成模型划分为有监督、无监督以及半监督三种,将人脸属性划分年龄、表情和妆容三大类语义,并对多种合成模型进行深入研究。其次,对典型的损失函数进行分析和总结,同时介绍了常用人脸属性数据集以及评价指标。最后介绍现有人脸属性合成方法面临的问题,并对该领域未来的发展提出展望。 展开更多
关键词 深度学习 生成对抗网络 人脸属性生成 人脸图像数据集 年龄 表情 妆容
在线阅读 下载PDF
基于ACGAN的图像识别算法 被引量:11
13
作者 周林勇 谢晓尧 +2 位作者 刘志杰 谭宏卫 游善平 《计算机工程》 CAS CSCD 北大核心 2019年第10期246-252,259,共8页
针对基于辅助分类器生成对抗网络(ACGAN)的图像分类算法在训练过程中稳定性低且分类效果差的问题,提出一种改进的图像识别算法CP-ACGAN。对于网络结构,在判别网络的输出层取消样本的真假判别,只输出样本标签的后验估计并引入池化层。对... 针对基于辅助分类器生成对抗网络(ACGAN)的图像分类算法在训练过程中稳定性低且分类效果差的问题,提出一种改进的图像识别算法CP-ACGAN。对于网络结构,在判别网络的输出层取消样本的真假判别,只输出样本标签的后验估计并引入池化层。对于损失函数,除真实样本的交叉熵损失外,在判别网络中增加生成样本的条件控制标签及后验估计间的交叉熵损失。在此基础上,利用真假样本的交叉熵损失及属性重构生成器和判别器的损失函数。在MNSIT、CIFAR10、CIFAR100数据集上的实验结果表明,与ACGAN算法、CNN算法相比,该算法具有较好的分类效果与稳定性,且分类准确率分别高达99.62%、79.07%、48.03%。 展开更多
关键词 生成对抗网络 辅助分类器生成对抗网络 特征提取 图像分类 特征匹配
在线阅读 下载PDF
基于GAN的医学图像仿真数据集生成算法 被引量:7
14
作者 孟琭 钟健平 李楠 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第3期332-336,共5页
基于生成对抗网络(generative adversarial networks,GAN),提出了面向肝脏肿瘤CT图像仿真数据集生成深度学习算法.首先,将CT图像数据文件进行格式解析,单独保存为PNG格式的图像文件;然后,将肝脏病变区域统一标注为白色,并结合肝脏CT原... 基于生成对抗网络(generative adversarial networks,GAN),提出了面向肝脏肿瘤CT图像仿真数据集生成深度学习算法.首先,将CT图像数据文件进行格式解析,单独保存为PNG格式的图像文件;然后,将肝脏病变区域统一标注为白色,并结合肝脏CT原图组成配对图片;最后,用生成对抗网络的pix2pix架构仿真生成病变肝脏图像.为将生成图像与目标图像进行定量分析、比较,本文采用了峰值信噪比和结构相似性作为模型的评价指标.实验结果表明,本文算法所生成的肝脏肿瘤CT仿真数据集的平均峰值信噪比为64.72 d B,平均结构相似性为0.9973,证明了所生成的仿真图像数据有着非常高的真实度. 展开更多
关键词 生成对抗网络 图像处理 肝脏图像仿真 参数调整 数据增强
在线阅读 下载PDF
基于生成对抗网络的两阶段探地雷达图像反演方法
15
作者 武铭泽 刘庆华 欧阳缮 《电波科学学报》 北大核心 2025年第1期141-154,共14页
在探地雷达(ground penetrating radar,GPR)应用中,反演成像是解译GPR数据信息的关键技术。现有基于深度学习的GPR图像反演技术大多应用于地下均匀介质的理想环境,然而真实环境中采集到的数据通常包含复杂的噪声与杂波信号,对反演精度... 在探地雷达(ground penetrating radar,GPR)应用中,反演成像是解译GPR数据信息的关键技术。现有基于深度学习的GPR图像反演技术大多应用于地下均匀介质的理想环境,然而真实环境中采集到的数据通常包含复杂的噪声与杂波信号,对反演精度有很大影响。针对这一问题,本文提出了一种基于生成对抗网络(generative adversarial network,GAN)的两阶段GPR图像反演网络TSInvNet,以重构真实环境中地下目标的位置分布。该方法先将GPR B-scan图像使用改进的空间自适应归一化(spatially-adaptive normalization,SPADE)生成器的去噪网络TSInvNet1进行处理后,接着送入引入置换注意力(shuffle attention,SA)模型的反演网络TSInvNet2进行反演。在模拟数据与真实数据上的实验结果表明,TSInvNet能够根据GPR B-scan图像准确反演出地下目标的位置,在具有复杂噪声与多目标情况下的反演应用中具有强鲁棒性和精确反演性能。 展开更多
关键词 探地雷达(GPR) 反演成像 深度学习 生成对抗网络(gan) 注意力模型
在线阅读 下载PDF
基于特征优化和GAN的红外与可见光图像融合算法 被引量:3
16
作者 郝帅 李嘉豪 +3 位作者 马旭 何田 孙思雅 李彤 《光子学报》 EI CAS CSCD 北大核心 2023年第12期232-247,共16页
针对红外与可见光融合图像存在纹理细节不丰富、对比度较低及目标信息损失等问题,提出了一种基于特征优化和生成对抗网络的图像融合算法。首先,设计一种自适应特征优化模块以增强原始图像纹理细节及对比度;然后,为使融合图像保留更多的... 针对红外与可见光融合图像存在纹理细节不丰富、对比度较低及目标信息损失等问题,提出了一种基于特征优化和生成对抗网络的图像融合算法。首先,设计一种自适应特征优化模块以增强原始图像纹理细节及对比度;然后,为使融合图像保留更多的多模态信息,将生成对抗网络引入到融合框架中。在生成器模型中,考虑到红外与可见光图像成像机理差异,构建了双支路特征提取网络,并设计多尺度密集连接模块以提取异源图像丰富的特征信息;其次,在融合层构造通道和空间注意力模型以增强局部特征之间联系,减小融合图像中目标信息损失;最后,为使融合结果尽可能保留可见光纹理细节的同时又能够较好突出红外目标,构造了双判别器网络结构。为验证所提算法优势,在TNO数据集上进行实验,并与6种经典融合算法进行主观和客观比较。实验结果表明,所提算法无论在主观还是客观评价上均具有明显优势,生成的融合图像纹理细节更为丰富、边缘及目标更加清晰且具有更好的对比度,客观评价指标信息熵、空间频率、相关熵、视觉保真度和梯度信息分别提高了16.11%、65.46%、7.96%、42.67%和33.24%。 展开更多
关键词 图像融合 特征优化 生成对抗网络 多尺度密集连接 注意力模型
在线阅读 下载PDF
基于跨域图像潜在空间多尺度融合的仿生设计算法应用
17
作者 章艺敏 黄晓英 +3 位作者 黄正洋 杨超翔 万永菁 蒋翠玲 《计算机工程》 北大核心 2025年第5期266-278,共13页
在工业设计领域,仿生设计是一种从自然界中汲取灵感并将生物特征与产品设计巧妙结合的方法。然而,传统仿生设计方法往往存在创新性不足的问题,难以有效融合抽象生物灵感与具象产品形态。为了解决上述问题,提出一种跨域图像多尺度仿生融... 在工业设计领域,仿生设计是一种从自然界中汲取灵感并将生物特征与产品设计巧妙结合的方法。然而,传统仿生设计方法往往存在创新性不足的问题,难以有效融合抽象生物灵感与具象产品形态。为了解决上述问题,提出一种跨域图像多尺度仿生融合算法BioFusion,旨在实现产品与生物特征的高质量融合。首先采用热启动优化反演方法,将图像映射至生成对抗网络(GAN)的生成器潜在空间,然后通过基于少样本微调的生成模型域扩展,将基于产品数据集训练的潜在空间扩展至包含生物特征的融合空间,之后提出一种跨域多尺度插值融合方法LISM,有效整合产品图像域和生物图像域的语义特征。在自建的产品数据集上训练该算法模型,并在反演质量及跨域图像融合效果方面将其与DGBID、Smooth Diffusion等方法进行对比,实验结果表明,BioFusion能够生成逼真且富有形态感知的融合图像,在弗雷谢特距离(FID)、图像插值标准差(ISTD)和融合图像质量(BIQI)上表现较好,分别达到34.65、18.37和1.11。此外,BioFusion在多尺度仿生融合方面表现良好,能够生成包含不同维度语义信息的融合图像,从而为设计者提供丰富的仿生设计灵感和参考。 展开更多
关键词 仿生设计 BioFusion算法 跨域图像 多尺度插值融合 生成对抗网络
在线阅读 下载PDF
基于GAN的高光谱溢油检测实验方案设计 被引量:2
18
作者 宋冬梅 王斌 +1 位作者 王海起 樊彦国 《实验室研究与探索》 CAS 北大核心 2022年第12期5-8,73,共5页
为实现高精度的海洋溢油高光谱遥感检测,设计了一种基于生成对抗网络(GAN)的高光谱溢油检测实验方案。方案利用光谱归一化和主成分分析方法对高光谱溢油图像进行预处理,以提高计算效率;构建以生成器和判别器对抗训练为特色的GAN网络模型... 为实现高精度的海洋溢油高光谱遥感检测,设计了一种基于生成对抗网络(GAN)的高光谱溢油检测实验方案。方案利用光谱归一化和主成分分析方法对高光谱溢油图像进行预处理,以提高计算效率;构建以生成器和判别器对抗训练为特色的GAN网络模型,以实现端到端的溢油检测;利用训练好的判别器对溢油高光谱影像进行分类。为验证新方法的有效性,利用在2010年7月大连新港海上溢油事故中获取的机载高光谱数据开展了实验验证。结果表明,提出的方法在2套数据集上的总体分类精度相对于RF和SVM分别提升了2.33%和0.77%,Kappa系数达到了96.17%和95.56%。可见设计的方案能够实现高精度的溢油检测。 展开更多
关键词 溢油检测 高光谱图像 生成对抗网络
在线阅读 下载PDF
基于MD-CGAN的脑部肿瘤图像生成方法研究 被引量:3
19
作者 何敏 邱圆 +1 位作者 易小平 郭畅宇 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第8期179-185,共7页
深度学习已广泛用于脑部磁共振(MR)图像分析中,但脑部肿瘤MR图像样本不足会严重影响深度学习模型的性能.提出基于多鉴别器循环一致性生成对抗网络(MD-CGAN)的样本生成方法.利用所提出的MD-CGAN生成脑部肿瘤病理区域图像,将生成的脑部肿... 深度学习已广泛用于脑部磁共振(MR)图像分析中,但脑部肿瘤MR图像样本不足会严重影响深度学习模型的性能.提出基于多鉴别器循环一致性生成对抗网络(MD-CGAN)的样本生成方法.利用所提出的MD-CGAN生成脑部肿瘤病理区域图像,将生成的脑部肿瘤病理区域图像覆盖脑部正常图像子区域,合成得到脑部肿瘤MR图像.MD-CGAN引入的双对抗损失避免了模型崩塌问题的产生,引入的循环一致性损失函数可以保证脑部正常子区域图像生成脑部肿瘤病理区域图像,从而使得MD-CGAN生成的图像具有高质量和多样性.以FID值作为评价指标,利用本文提出的MD-CGAN与近几年较经典的生成网络生成脑部肿瘤病理区域图像并计算FID值.实验结果表明,本文所提出网络的FID值比SAGAN、StyleGAN和StyleGAN2的值分别低26.43%、21.91%、12.78%.为进一步验证本文方法的有效性,利用生成的脑部肿瘤图像扩充样本,并依托扩充前后的样本集进行脑部肿瘤分割网络训练.实验表明,样本扩充后的分割网络性能更优异.本文方法生成的脑部肿瘤MR图像质量高、多样性强,这些样本可代替真实样本参与模型的训练,从而有效解决脑部肿瘤MR图像训练样本不足的问题. 展开更多
关键词 深度学习 磁共振图像 样本扩充 生成对抗网络
在线阅读 下载PDF
面向红外与可见光图像融合的改进双鉴别器生成对抗网络算法
20
作者 廖光凤 关志伟 陈强 《红外技术》 北大核心 2025年第3期367-375,共9页
针对现有的红外与可见光图像融合算法对全局和多尺度特征提取不充分,对不同模态图像的关键信息提取不精准的问题,提出了基于双鉴别器生成对抗网络的红外与可见光图像融合算法。首先,生成器结合卷积和自注意力机制,捕获多尺度局部特征和... 针对现有的红外与可见光图像融合算法对全局和多尺度特征提取不充分,对不同模态图像的关键信息提取不精准的问题,提出了基于双鉴别器生成对抗网络的红外与可见光图像融合算法。首先,生成器结合卷积和自注意力机制,捕获多尺度局部特征和全局特征;其次,将注意力机制与跳跃连接结合,充分利用多尺度特征并减少下采样过程中的信息丢失;最后,两个鉴别器引导生成器关注红外图像的前景显著目标和可见光图像的背景纹理信息,使融合图像保留更多关键信息。在公开数据集M~3FD和MSRS上的实验结果表明,与对比算法相比,6种评价指标结果显著提高,其中平均梯度(Average Gradient, AG)在两个数据集上相较于次优结果分别提高了27.83%和21.06%。本文算法的融合结果细节丰富,具有较好的视觉效果。 展开更多
关键词 图像融合 生成对抗网络 双鉴别器 红外图像
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部