针对现有图像拼接技术因依赖特征匹配导致的伪影、失真等问题,提出一种基于无监督的图像拼接方法。该方法包含无监督图像配准和无监督图像融合两个阶段。在配准阶段,通过融合多尺度特征和高效局部注意力机制(efficient local attention,...针对现有图像拼接技术因依赖特征匹配导致的伪影、失真等问题,提出一种基于无监督的图像拼接方法。该方法包含无监督图像配准和无监督图像融合两个阶段。在配准阶段,通过融合多尺度特征和高效局部注意力机制(efficient local attention,ELA)改进残差块,进行跨尺度特征融合和动态特征增强,并结合交叉注意力(cross-attention)构建交互感知增强模块,促进图像对之间特征信息的深度交互与融合。进一步提出多尺度渐进变换配准模块,通过分层优化策略逐步校准图像变换关系,显著提升对齐精度。在融合阶段,引入动态软掩膜预测机制,基于像素级连续权重学习,实现重叠区域的平滑过渡与细节保持。为支撑无监督训练,构建了涵盖复杂光照、多视差场景的真实图像拼接数据集。实验表明,相较于现有传统和深度学习拼接算法,该方法在PSNR、SSIM上分别达到27.31、0.84,且视觉上拼接效果更好,抗干扰能力更强。展开更多
文摘针对现有图像拼接技术因依赖特征匹配导致的伪影、失真等问题,提出一种基于无监督的图像拼接方法。该方法包含无监督图像配准和无监督图像融合两个阶段。在配准阶段,通过融合多尺度特征和高效局部注意力机制(efficient local attention,ELA)改进残差块,进行跨尺度特征融合和动态特征增强,并结合交叉注意力(cross-attention)构建交互感知增强模块,促进图像对之间特征信息的深度交互与融合。进一步提出多尺度渐进变换配准模块,通过分层优化策略逐步校准图像变换关系,显著提升对齐精度。在融合阶段,引入动态软掩膜预测机制,基于像素级连续权重学习,实现重叠区域的平滑过渡与细节保持。为支撑无监督训练,构建了涵盖复杂光照、多视差场景的真实图像拼接数据集。实验表明,相较于现有传统和深度学习拼接算法,该方法在PSNR、SSIM上分别达到27.31、0.84,且视觉上拼接效果更好,抗干扰能力更强。