期刊文献+
共找到519篇文章
< 1 2 26 >
每页显示 20 50 100
Super-resolution image reconstruction based on three-step-training neural networks
1
作者 Fuzhen Zhu Jinzong Li Bing Zhu Dongdong Ma 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2010年第6期934-940,共7页
A new method of super-resolution image reconstruction is proposed, which uses a three-step-training error backpropagation neural network (BPNN) to realize the super-resolution reconstruction (SRR) of satellite ima... A new method of super-resolution image reconstruction is proposed, which uses a three-step-training error backpropagation neural network (BPNN) to realize the super-resolution reconstruction (SRR) of satellite image. The method is based on BPNN. First, three groups learning samples with different resolutions are obtained according to image observation model, and then vector mappings are respectively used to those three group learning samples to speed up the convergence of BPNN, at last, three times consecutive training are carried on the BPNN. Training samples used in each step are of higher resolution than those used in the previous steps, so the increasing weights store a great amount of information for SRR, and network performance and generalization ability are improved greatly. Simulation and generalization tests are carried on the well-trained three-step-training NN respectively, and the reconstruction results with higher resolution images verify the effectiveness and validity of this method. 展开更多
关键词 image reconstruction super-resolution three-steptraining neural network BP algorithm vector mapping.
在线阅读 下载PDF
基于改进型生成对抗网络的矿井图像超分辨重建方法研究 被引量:1
2
作者 张帆 刘莹 +2 位作者 宋惠 张嘉荣 程海星 《煤炭科学技术》 北大核心 2025年第S1期338-345,共8页
智能化无人开采是煤炭资源绿色、智能、安全、高效开采的技术发展趋势,高分辨率的矿井图像能够为煤矿智能开采和智能监控提供关键技术支撑。针对煤矿井下雾尘环境,目前采用常规的深度学习方法虽然能够提高矿井图像重建效果,但是受井下... 智能化无人开采是煤炭资源绿色、智能、安全、高效开采的技术发展趋势,高分辨率的矿井图像能够为煤矿智能开采和智能监控提供关键技术支撑。针对煤矿井下雾尘环境,目前采用常规的深度学习方法虽然能够提高矿井图像重建效果,但是受井下环境噪声影响,模型训练的稳定性较差,难以获得矿井图像的重建高频信息,导致图像重构质量欠佳,易出现矿井图像模糊和分辨率下降等问题。针对上述问题,提出一种基于生成对抗网络的矿井图像超分辨率重建方法。该方法基于SRGAN网络,对网络结构和损失函数进行改进优化,在生成器的浅层特征提取层和重建层分别采用2个5×5的卷积层,并在浅层特征提取层的每个卷积层后加入非线性激活函数,深层特征提取层采用残差结构,通过级联亚像素卷积层以实现矿井图像不同倍数的超分辨重建;采用Wasserstein距离对损失函数进行改进,并去掉判别器输出层的Sigmoid,使用RMSProp方法对网络进行优化,提高模型训练的收敛速度和稳定性;利用训练好的生成器模型,据此分别对矿井图像进行2倍和4倍超分辨重建,并对实验结果进行主观视觉分析和客观评价。结果表明,与传统的双三次插值、SRCNN、SRGAN相比,在相同缩放因子条件下,所提方法的峰值信噪比分别提升了2.68、1.50和1.59 dB,结构相似性分别提升了0.033 4、0.004 8和0.006 1,所提方法能够重建出清晰的矿井图像纹理和细节信息,在主观视觉上以及峰值信噪比和结构相似性上都实现了更好的重建效果,且整体性能优于其他几种方法,有效提高了矿井图像的分辨率。 展开更多
关键词 煤矿智能化 矿井图像 超分辨重建 生成对抗网络 SRGAN
在线阅读 下载PDF
考虑局部纹理特征和全局温度分布的电力设备红外图像超分辨率重建方法 被引量:1
3
作者 赵洪山 王惠东 +5 位作者 刘婧萱 杨伟新 李忠航 林诗雨 余洋 吕廷彦 《电力系统保护与控制》 北大核心 2025年第2期89-99,共11页
针对传统电力设备红外图像超分辨率重建方法缺乏对设备局部纹理特征和全局温度分布的考虑导致重建后图像分辨率较低的问题,提出一种基于Transformer-GAN聚合网络的电力设备超分辨率重建方法。首先,基于移位卷积设计电力设备局部特征提... 针对传统电力设备红外图像超分辨率重建方法缺乏对设备局部纹理特征和全局温度分布的考虑导致重建后图像分辨率较低的问题,提出一种基于Transformer-GAN聚合网络的电力设备超分辨率重建方法。首先,基于移位卷积设计电力设备局部特征提取模块,在不增加参数情况下扩展卷积的感受野,提取电力设备局部纹理及其周围不同空间维度特征的信息。然后,引入全局特征提取模块,通过深度卷积和空间注意力机制捕捉图像不同区域间温度分布的关联性。最后,采用UNet编解码器网络融合各层局部特征和全局表示,生成清晰自然的电力设备红外图像。算例结果表明,所提方法的峰值信噪比(peak signal-to-noise ratio,PSNR)、结构相似性(structural similarity,SSIM)、和视觉信息保真度(visual information fidelity,VIF)三项评价指标均优于其他方法。同时它具有良好的主观视觉效果,泛化能力较强。 展开更多
关键词 电力设备 红外图像 超分辨率重建 局部纹理特征 全局温度分布 Transformer-GAN
在线阅读 下载PDF
基于深度学习的复合超分辨率重建算法在膝关节MRI中的临床应用价值
4
作者 王超 谢晓亮 +4 位作者 朱熹 黄文诺 尚松安 叶靖 王志军 《放射学实践》 北大核心 2025年第1期67-72,共6页
目的:探讨临床环境中通过优化扫描参数结合基于深度学习的复合超分辨率重建算法在提升膝关节MRI扫描效率和图像质量的可行性。方法:前瞻性搜集110例行膝关节MRI平扫的患者,先后进行常规(常规组)与复合超分辨率重建算法扫描(复合组),采... 目的:探讨临床环境中通过优化扫描参数结合基于深度学习的复合超分辨率重建算法在提升膝关节MRI扫描效率和图像质量的可行性。方法:前瞻性搜集110例行膝关节MRI平扫的患者,先后进行常规(常规组)与复合超分辨率重建算法扫描(复合组),采用双盲法比较两组主客观图像质量。结果:相较常规组,复合组PD和T1序列的骨髓、软骨、半月板、韧带、肌肉、脂肪、关节液的SNR分别提升89.3%、52.5%、65.3%、73.8%、60.3%、103.9%、58.9%和78.0%、172.9%、78.0%、72.5%、75.4%、63.4%、97.0%。相较常规组,复合组PD和T1序列的软骨-关节液、软骨-骨髓、半月板-关节液、韧带-关节液、骨髓-关节液、脂肪-关节液、肌肉-关节液的CNR分别提升119.5%、83.3%、116.2%、109.2%、109.2%、99.3%、116.8%和61.7%、23.1%、78.7%、32.5%、161.7%、44.9%、39.2%。复合组的峰值信噪比(PSNR)相较常规组显著提高(P<0.05),结构相似度(SSIM)均>0.999。主观图像质量评价中复合组病灶边缘区分度、运动伪影和综合诊断度的主观评分显著高于常规组(P<0.05),两组病灶辨别度的主观评分差异无统计学意义(P>0.05)。结论:合理优化扫描参数并结合基于深度学习的复合超分辨率重建算法可在提升扫描效率的同时显著提高膝关节MRI的图像质量和综合诊断效果。 展开更多
关键词 卷积神经网络 深度学习 膝关节 磁共振成像 超分辨率重建
在线阅读 下载PDF
石油输送管道微小缺陷智能检测方法
5
作者 胡青松 李飞 +3 位作者 单露露 刘许 李世银 孙彦景 《西安石油大学学报(自然科学版)》 北大核心 2025年第4期134-142,共9页
管道缺陷特征在管道漏磁图像中通常表现为小目标甚至微目标,且与图像背景区分度弱,严重影响了智能检测的准确度。为解决该问题,提出一种新颖的输油管道缺陷小目标智能检测方法。首先,对获取到的管道漏磁数据进行预处理,为后续智能检测... 管道缺陷特征在管道漏磁图像中通常表现为小目标甚至微目标,且与图像背景区分度弱,严重影响了智能检测的准确度。为解决该问题,提出一种新颖的输油管道缺陷小目标智能检测方法。首先,对获取到的管道漏磁数据进行预处理,为后续智能检测奠定基础。随后,构建管道缺陷智能检测网络,它以YOLOv4为基准网络,通过引入RFB模块增强感受野,提高不同尺度特征的提取能力;通过增加注意力机制,提高网络对微小缺陷的关注度;通过对主干网络的轻量化,显著提升检测速度。最后,通过低质量漏磁图像的超分辨率重建,使得缺陷特征信息更丰富更明显,进一步提升检测精确度。实验表明:该算法的模型大小降低了79%,所有缺陷的实际检测准确度都在95%以上,部分缺陷的准确度达到了100%,能够满足现场实际需求。 展开更多
关键词 漏磁图像 缺陷检测 网络轻量化 注意力机制 超分辨率重建
在线阅读 下载PDF
基于选通图像的超分辨率重建算法研究
6
作者 张正 郑颖俏 田青 《电子测量技术》 北大核心 2025年第9期189-197,共9页
激光距离选通技术能突破传统成像在雨雪雾、低光照和逆强光等复杂环境中无法成像的限制,但生成的选通图像是低质量灰度图,需要超分辨率重建技术着重于边缘信息和空间细节的重建,以提升视觉效果。由于选通图像缺乏颜色和丰富纹理信息,传... 激光距离选通技术能突破传统成像在雨雪雾、低光照和逆强光等复杂环境中无法成像的限制,但生成的选通图像是低质量灰度图,需要超分辨率重建技术着重于边缘信息和空间细节的重建,以提升视觉效果。由于选通图像缺乏颜色和丰富纹理信息,传统的特征提取方法容易产生冗余特征,影响重建效率。针对上述问题,本文提出了一种双聚合深层特征提取网络。首先,通过空间和通道重建卷积(SCConv)进行浅层特征提取,提高信息含量并解决冗余问题;其次,设计了一种新的深层特征提取模块,增强对选通图像边缘和细节的捕捉;最后,采用连续的最近邻插值加卷积操作进行图像重建,有效避免伪影问题。在选通图像数据集上的实验表明,相比基线的DAT算法,本文所提方法PNSR指标在2、3和4倍分辨率退化情况下分别提升了0.19 dB、0.12 dB和0.04 dB,SSIM在2、3和4倍分辨率退化情况下分别提升了0.0005、0.0008和0.0010,结果表明本文方法可以取得较好的视觉效果。 展开更多
关键词 选通图像 超分辨率重建 边缘增强
在线阅读 下载PDF
融合超分辨率重建的YOLOv7煤矸石识别模型
7
作者 李娜 秦昆德 +1 位作者 李想 张澳迪 《计算机工程与应用》 北大核心 2025年第15期343-352,共10页
在洗煤场景下拍摄的影像中煤矸石目标光照低且分布不均匀,同时在洗煤过程中目标存在遮挡、过曝或逆光现象,使得边界和纹理较模糊,提取特征过程中纹理特征容易丢失,造成误检。因此,对不均匀低光照的煤矸石目标检测方法进行研究,提出一种... 在洗煤场景下拍摄的影像中煤矸石目标光照低且分布不均匀,同时在洗煤过程中目标存在遮挡、过曝或逆光现象,使得边界和纹理较模糊,提取特征过程中纹理特征容易丢失,造成误检。因此,对不均匀低光照的煤矸石目标检测方法进行研究,提出一种融合超分辨率重建的煤矸石识别模型。对于图像中的小目标煤矸石,利用超分辨率重建技术将分辨率提高后再进一步利用YOLOv7模型检测目标以提升整体检测效果。在超分辨重建模块中加入煤矸石锐化功能模块,提升煤矸石目标边缘清晰度,以保证在特征提取时通过浅层特征层能更好地提取煤矸石目标轮廓、形状等信息。在构建的煤矸石数据集上进行煤矸石目标检测,实验结果表明,改进后算法在煤、矸石检测任务中平均精度分别达到99.52%与98.84%。且模型在非均匀光照、粉尘干扰场景保持识别稳定性,煤、矸石漏检率分别降低18和17个百分点。改善了小目标与纹理模糊目标识别困难问题,为煤矸石识别提供技术参考。 展开更多
关键词 煤矸石检测 超分辨率重建 小目标检测 图像识别
在线阅读 下载PDF
卷积神经网络在图像超分辨上的应用 被引量:1
8
作者 田春伟 宋明键 +3 位作者 左旺孟 杜博 张艳宁 张师超 《智能系统学报》 北大核心 2025年第3期719-749,共31页
卷积神经网络因强大的学习能力,已成为解决图像超分辨问题的主流方法。然而,用于解决图像超分辨的不同类型深度学习方法存在巨大的差异。目前,仅有少量文献能根据不同缩放方法来总结不同深度学习技术在图像超分辨上的区别和联系。因此,... 卷积神经网络因强大的学习能力,已成为解决图像超分辨问题的主流方法。然而,用于解决图像超分辨的不同类型深度学习方法存在巨大的差异。目前,仅有少量文献能根据不同缩放方法来总结不同深度学习技术在图像超分辨上的区别和联系。因此,根据设备的负载能力和执行速度等介绍面向图像超分辨方法的卷积神经网络尤为重要。本文首先介绍面向图像超分辨的卷积神经网络基础,随后通过介绍基于双三次插值、最近邻插值、双线性插值、转置卷积、亚像素层、元上采样的卷积神经网络的图像超分辨方法,分析基于插值和模块化的卷积神经网络图像超分辨方法的区别与联系,并通过实验比较这些方法的性能。本文对潜在的研究方向和挑战进行阐述并总结全文,旨在促进基于卷积神经网络的图像超分辨研究的发展。 展开更多
关键词 深度学习 卷积神经网络 图像重建 图像处理 图像复原 图像分辨率 神经网络 底层视觉
在线阅读 下载PDF
基于CNN和Transformer聚合的遥感图像超分辨率重建 被引量:1
9
作者 胡明志 孙俊 +2 位作者 杨彪 常开荣 杨俊龙 《浙江大学学报(工学版)》 北大核心 2025年第5期938-946,共9页
针对现有的遥感图像超分辨模型很少考虑噪声、模糊、JPEG压缩等因素对图像重建所带来的影响,以及Transformer模块构建高频信息能力受限的问题,提出多层退化模块.设计基于CNN和Transformer聚合的网络,使用CNN识别图像的高频信息,Transfor... 针对现有的遥感图像超分辨模型很少考虑噪声、模糊、JPEG压缩等因素对图像重建所带来的影响,以及Transformer模块构建高频信息能力受限的问题,提出多层退化模块.设计基于CNN和Transformer聚合的网络,使用CNN识别图像的高频信息,Transformer提取全局信息.利用基于注意力机制的聚合模块将2个模块聚合,在保持全局结构连贯性的同时,显著增强局部高频细节的重建精度.利用所提模型,在AID数据集上随机选取6个场景进行实验,与MM-realSR模型在PSNR和SSIM指标上进行比较.结果表明,所提模型在PSNR指标上相比于MM-realSR模型平均提高1.61 dB,SSIM指标平均提升0.023. 展开更多
关键词 遥感图像 超分辨率重建 多层退化模块 高频信息 全局信息 聚合模块
在线阅读 下载PDF
梯度引导的JPEG压缩图像超分辨率重建
10
作者 曹坪 林树冉 +2 位作者 张淳杰 郑晓龙 赵耀 《自动化学报》 北大核心 2025年第6期1261-1276,共16页
在真实场景中,图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响.现有方法通常聚焦于单一退化类型,难以应对复杂的复合退化情况.为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题,提出一种梯度引导的联合JPE... 在真实场景中,图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响.现有方法通常聚焦于单一退化类型,难以应对复杂的复合退化情况.为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题,提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络.该网络以超分辨率分支为主导,融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征,实现了高质量图像重建.JPEG压缩伪影去除分支专注于压缩伪影抑制,缓解了主导分支的重建负担.梯度引导分支则精准估计图像梯度,引导主导分支恢复更多细节与纹理.实验结果表明,该方法提升了低分辨率JPEG压缩图像的重建质量. 展开更多
关键词 JPEG压缩 超分辨率 图像重建 梯度先验
在线阅读 下载PDF
复合材料构件超声C扫描图像去噪与超分辨研究
11
作者 徐振业 刘振浩 +2 位作者 钱恒奎 金士杰 罗忠兵 《航空制造技术》 北大核心 2025年第19期110-117,共8页
针对大厚度蜂窝夹层复合材料构件超声检测图像噪声强、分辨率低、缺陷识别困难等问题,本文以C919主起落架内舱门为研究对象,开展了超声C扫描图像去噪与超分辨重构方法研究。提出一种基于梯度下降算法的高效边缘保护滤波方案,能有效去除... 针对大厚度蜂窝夹层复合材料构件超声检测图像噪声强、分辨率低、缺陷识别困难等问题,本文以C919主起落架内舱门为研究对象,开展了超声C扫描图像去噪与超分辨重构方法研究。提出一种基于梯度下降算法的高效边缘保护滤波方案,能有效去除斑点噪声,较好地保留图像细节信息。去噪图像峰值信噪比达到37.53 dB,结构相似性达到0.92,比传统数字形态学滤波法分别提升了12.99 dB和0.04。改进的深度残差超分辨网络(Improved super-resolution residual network,ISRResNet)重构图像分辨率高、细节丰富、边缘纹理清晰。对含Φ11 mm分层缺陷图像处理后,缺陷信噪比平均提升6.25 dB。结果表明,本文去噪方法和超分辨模型可以有效去除斑点噪声,提高图像分辨率和缺陷定量准确性,支撑大厚度蜂窝夹层复合材料构件的高质量检测。 展开更多
关键词 复合材料 超声C扫描 图像去噪 超分辨重构 深度学习 缺陷检测
在线阅读 下载PDF
耦合反馈网络用于极端图像融合和超分辨率
12
作者 陶恒芝 端木春江 叶涛 《计算机工程与设计》 北大核心 2025年第9期2457-2464,共8页
针对传统的超分辨率图像算法无法处理工业领域中极度曝光的问题,提出一种图像超分辨率和图像多曝光融合算法。在网络耦合阶段引入稠密连接的方法,通过上下采样的方式最大限度保留住极度曝光图像的原有特征,在超分阶段引入多种注意力机... 针对传统的超分辨率图像算法无法处理工业领域中极度曝光的问题,提出一种图像超分辨率和图像多曝光融合算法。在网络耦合阶段引入稠密连接的方法,通过上下采样的方式最大限度保留住极度曝光图像的原有特征,在超分阶段引入多种注意力机制进行特征提取;通过叠加不同曝光程度的超分图像得到融合后兼具高分辨率和高动态范围的图像。基于自制工程数据集实验,其结果表明,该算法在多种指标下均优于比较模型。 展开更多
关键词 图像超分辨率 图像多曝光融合 稠密连接 极度曝光 注意力机制 图像处理 深度学习
在线阅读 下载PDF
基于CBAM-SRResNet的水下图像超分辨率重建研究 被引量:1
13
作者 杨同 魏为民 +2 位作者 符程程 杨天澄 薛梅 《电子测量技术》 北大核心 2025年第1期20-28,共9页
由于水体特性对光的吸收和散射作用,水下图像通常呈现细节模糊、分辨率低等问题,为提升水下图像的清晰度,提出一种基于CBAM-SRResNet的水下图像超分辨率重建方法。该方法将混合注意力机制引入到深度残差网络中,从而提高水下图像的清晰... 由于水体特性对光的吸收和散射作用,水下图像通常呈现细节模糊、分辨率低等问题,为提升水下图像的清晰度,提出一种基于CBAM-SRResNet的水下图像超分辨率重建方法。该方法将混合注意力机制引入到深度残差网络中,从而提高水下图像的清晰度。其次,引入结构相似性损失函数,从而能够更好地保护图像内容,提高图像质量,使得训练结果更加符合人类视觉感知。实验结果显示,基于CBAM-SRResNet的水下图像超分辨率重建方法能够有效地处理水下图像模糊、分辨率低等问题,在不同数据集上与其他多种水下图像重建方法相比,该方法在PSNR上提高了0.69~2.43 dB,在SSIM上提高了2.66%~7.17%,在各项性能指标上均表现优异。 展开更多
关键词 水下图像 注意力机制 超分辨率重建 SRResNet
在线阅读 下载PDF
改进Transformer的肺部CT图像超分辨率重建
14
作者 刘杰 吴优 +1 位作者 田佳禾 韩轲 《浙江大学学报(工学版)》 北大核心 2025年第7期1434-1442,共9页
肺部CT图像灰度级别丰富,导致特征提取不充分、重建细节较差,为此提出基于局部增强Transformer和U-Net的肺部CT图像超分辨率重建网络.采用空洞卷积进行多感受野的深层特征提取,在不同膨胀率的空洞卷积层下获得全局图像信息,进行不同感... 肺部CT图像灰度级别丰富,导致特征提取不充分、重建细节较差,为此提出基于局部增强Transformer和U-Net的肺部CT图像超分辨率重建网络.采用空洞卷积进行多感受野的深层特征提取,在不同膨胀率的空洞卷积层下获得全局图像信息,进行不同感受野下的特征信息融合.将通过3×3卷积层获得的原始特征送入结合所提网络的编解码结构中,在局部增强窗口模块的作用下减小计算量并捕获局部信息.在解码阶段,为了提高重建图像的质量,使用跳跃连接并加入融合空间注意力和通道注意力的分割注意模块,进行无用信息丢弃和有用信息利用.实验结果表明,在SARS-CoV-2数据集中,所提网络与Transformer网络相比,4倍超分辨率的结构相似性和峰值信噪比分别提高了0.029和0.186 dB. 展开更多
关键词 肺部CT图像 超分辨率重建 TRANSFORMER 空洞卷积 分割注意力
在线阅读 下载PDF
基于偏振成像与深度学习的浑浊水体水下结构表观缺陷检测
15
作者 吕宗桀 李俊杰 张学武 《长江科学院院报》 北大核心 2025年第9期156-166,共11页
浅水环境常呈现浑浊特征,导致光学图像出现模糊、色偏、对比度低等问题。浑浊水体中散射粒子会遮蔽水下结构表观缺陷信息,造成缺陷识别率低、检测效率低和分类不准等问题。针对这些挑战,提出一种基于偏振成像和深度学习的轻量级三阶段... 浅水环境常呈现浑浊特征,导致光学图像出现模糊、色偏、对比度低等问题。浑浊水体中散射粒子会遮蔽水下结构表观缺陷信息,造成缺陷识别率低、检测效率低和分类不准等问题。针对这些挑战,提出一种基于偏振成像和深度学习的轻量级三阶段水下缺陷检测方法,借助偏振复原模型、超分辨率重建模型和缺陷检测模型3个子模型实现缺陷检测。偏振复原模型用于实现浑浊水体的清晰成像和水下缺陷图像复原,CAA-SRGAN超分辨率重建模型用于获取高分辨率水下缺陷图像,CBAM-YOLOv7缺陷检测模型用于检测水下结构常见的裂缝、孔洞和剥落缺陷,最终形成适用于浑浊水体水下结构的PCC-YOLOv7缺陷检测模型。分别通过与现有先进图像复原、超分辨率重建和目标检测方法进行对比分析,结果显示3个子模型的输出结果在各自评价指标中均有提升。PCC-YOLOv7缺陷检测模型对平均精确度指标(mAP 0.5、mAP 0.75、mAP 0.5~0.95)的提升幅度均值达33.5%。本文所构建的模型相较于现有模型,对浑浊水下检测场景有着更强的适配性,能够为浑浊水体中水下结构表观缺陷检测工作提供切实可行的方法。 展开更多
关键词 浑浊水体 水下结构 缺陷检测 偏振成像 深度学习 超分辨率重建
在线阅读 下载PDF
多模态语义交互的文本图像超分辨率重构 被引量:1
16
作者 韩玉兰 罗轶宏 +1 位作者 崔玉杰 兰朝凤 《光学精密工程》 北大核心 2025年第1期135-147,共13页
针对现有方法在文本图像特征表示缺乏尺度变换,分辨率不足导致识别器难以提取到正确的文本内容信息指导重构网络的问题,提出多模态语义交互的文本图像超分辨率重构方法。利用语义推理模块中的注意力掩码对文本内容信息进行校正,获得语... 针对现有方法在文本图像特征表示缺乏尺度变换,分辨率不足导致识别器难以提取到正确的文本内容信息指导重构网络的问题,提出多模态语义交互的文本图像超分辨率重构方法。利用语义推理模块中的注意力掩码对文本内容信息进行校正,获得语义先验信息,约束并指导网络重构语义正确的文本超分辨率重构图像。为增强网络的表征能力,适应不同形状和长度的文本图像,设计了多模态语义交互块,其基本单元由视觉双流集成块、跨模态自适应融合块和正交双向门控循环单元组成。视觉双流集成块利用全局统计特性和局部拟合能力互补优势,获得包含上下文理解的多粒度视觉信息,跨模态自适应融合块动态执行语义信息与多粒度视觉特征之间的交互协作,缩小模态间的特征差异;最后,正交双向门控循环单元建立多模态特征在垂直和水平方向上的文本依赖。实验结果表明,在TextZoom测试集上,本文提出的方法在PSNR和SSIM定量指标上相比于其他主流方法均有所提升,并且在ASTER,MORAN,CRNN 3种识别器的平均识别精度相比TPGSR模型分别提高了2.9%,3.6%和3.7%。由此表明,采用多模态语义交互方法的文本图像超分辨率重构,可以有效提高文本识别精度。 展开更多
关键词 超分辨率重构 文本图像 多粒度 语义先验 多模态
在线阅读 下载PDF
基于扩散模型加速和感知优化的高效姿态驱动人体动作生成技术
17
作者 王家松 周雷 张博 《计算机应用研究》 北大核心 2025年第10期2964-2971,共8页
现有姿势条件驱动的数字人视频生成技术主要聚焦于提升生成结果的质量,如视觉逼真度和动作流畅性。然而往往忽视了生成速度较慢的问题,从而限制了其在实时性应用中的有效部署。为此,针对基于扩散模型的数字人生成技术推理延迟高、计算... 现有姿势条件驱动的数字人视频生成技术主要聚焦于提升生成结果的质量,如视觉逼真度和动作流畅性。然而往往忽视了生成速度较慢的问题,从而限制了其在实时性应用中的有效部署。为此,针对基于扩散模型的数字人生成技术推理延迟高、计算成本大的问题,提出了一种基于扩散模型加速和感知优化的加速框架(DAF-DH)。该方法采用三级加速策略来提高效率并优化生成质量。首先,通过TensorRT优化扩散模型的推理效率;其次,利用基于TensorRT加速的扩散模型,结合降低输入分辨率和抽帧生成的方式,快速生成低分辨率、低帧率的初始视频;最后,设计一个轻量化后处理模块,通过超分辨率和插帧算法提升视频的分辨率和流畅度,从而优化最终生成质量。同时,为了提升主观质量,引入语义特征对齐损失函数,进一步优化视觉感知效果。此外,构建了包含1705个动作序列的DH-Motion数据集,为研究提供基准。实验结果表明,该框架在MimicMotion基础上实现5倍加速比,生成质量有所提升,LPIPS指标降低0.033,FVD指标减少82.9。这些结果证明DAF-DH有效降低了推理延迟,提升了生成质量,适用于实时数字人视频生成应用。 展开更多
关键词 视频生成 扩散模型 加速技术 图像超分 视频插帧 数字人 感知质量
在线阅读 下载PDF
从放缩到重构的Swin Transformer图像矩形化网络
18
作者 杨利春 党建武 +2 位作者 王梦思 张天胤 田彬 《计算机工程与应用》 北大核心 2025年第12期258-266,共9页
图像矩形化旨在解决拼接后的图像所存在的边界不规则问题。现有的矩形化方法通过多步扭曲处理来实现图像的矩形化处理。但是这些方法仍然存在一定的内容失真及边界破损等问题。为了解决这些问题,提出了一种单步扭曲处理的图像矩形化解... 图像矩形化旨在解决拼接后的图像所存在的边界不规则问题。现有的矩形化方法通过多步扭曲处理来实现图像的矩形化处理。但是这些方法仍然存在一定的内容失真及边界破损等问题。为了解决这些问题,提出了一种单步扭曲处理的图像矩形化解决方案(IRFormer)。具体来说,结合了尺度放缩策略,构建了一个基于Swin Transformer架构的低分辨率单步扭曲分支;结合轻量化策略,构建了一个高分辨率重建及边界修复的分支。通过广泛的实验,验证了IRFormer在多种场景中均具有良好的矩形化表现,具有较高的内容保真性和边界完整性。在定性和定量比较中,IRFormer均展现出了最先进的矩形化性能。 展开更多
关键词 图像矩形化 单级网格预测 尺度放缩 Swin Transformer 超分辨率重建
在线阅读 下载PDF
彩色图像引导高低频特征调制融合的深度图像超分辨率算法研究
19
作者 徐晗智 李嘉莹 +1 位作者 梁宇栋 魏巍 《计算机科学》 北大核心 2025年第6期228-238,共11页
深度图像能够有效描述三维场景的信息,然而由于采集设备的局限性和不理想的成像环境,深度传感器获取的深度图像往往分辨率较低、高频信息较少,提高深度图像的分辨率具有重要意义。部分深度图超分辨率算法通过引入同一场景下的RGB图像为... 深度图像能够有效描述三维场景的信息,然而由于采集设备的局限性和不理想的成像环境,深度传感器获取的深度图像往往分辨率较低、高频信息较少,提高深度图像的分辨率具有重要意义。部分深度图超分辨率算法通过引入同一场景下的RGB图像为深度图超分辨率过程提供指导信息,显著提升了算法性能。如何充分、有效地利用RGB信息,改善深度图和RGB图像的模态不一致性,引导深度图超分辨率重建过程极具挑战。已有方法多关注于高频信息,忽略了低频全局的信息,影响了算法性能的提升。对此,提出了彩色图像引导的、高低频特征调制融合的深度图像超分辨率重建算法。具体地,设计了一个双分支特征提取模块,分别针对彩色图像和深度图像进行高低频特征提取,在各个分支采用CNN和Transformer分别提取局部高频和全局低频信息,通过构造双向调制模块,实现对彩色和深度图像高频信息之间和低频信息之间的双向转换与融合。模型经过不同模态不同频率内的双向调制及后续高低频信息的融合,充分挖掘深度图像与彩色图像之间的互补信息,使得基于彩色图像引导的深度超分辨率算法能够取得更好的重建效果。另外,利用可逆神经网络INN进行无损信息压缩,以更好地提取高频细节信息,采用四叉树注意力机制有效降低了Transformer提取全局信息的计算复杂度,提高了算法效率。在公开数据集上进行了实验,结果表明,所提方法在定量和定性两方面均优于对比方法,取得了较好的主观视觉效果。 展开更多
关键词 深度图超分重建 混合特征 双向调制 四叉树注意力机制
在线阅读 下载PDF
强化散射特征的机载SAR实传图像盲超分辨重建
20
作者 贾钰嘉 张思乾 +1 位作者 唐涛 匡纲要 《系统工程与电子技术》 北大核心 2025年第3期753-767,共15页
现有超分辨方法大多基于理想退化模型且易导致强散射信息均值化,不适用于机载合成孔径雷达(synthetic aperture radar,SAR)实传图像的超分辨重建。针对该问题,在机载SAR实传图像和精细成像图像之间建立了一个盲超分辨重建网络。首先,采... 现有超分辨方法大多基于理想退化模型且易导致强散射信息均值化,不适用于机载合成孔径雷达(synthetic aperture radar,SAR)实传图像的超分辨重建。针对该问题,在机载SAR实传图像和精细成像图像之间建立了一个盲超分辨重建网络。首先,采用生成对抗网络学习两个图像域之间的映射关系。其次,通过注意力机制引导网络关注强散射区域。然后,利用感知循环一致性损失保留图像纹理特征。最后,在实测机载SAR数据集上验证了算法有效性,重建结果的人类视觉系统信噪比和辐射分辨率分别提升了约30%和20%。特征分析及可视化表明,所提方法提高了图像质量且重建出清晰的强散射特征。 展开更多
关键词 机载合成孔径雷达 实传图像 强化散射特征 盲超分辨重建 生成对抗网络
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部