多编码器和单解码器(multi encoder and single decoder,MESD)架构在变化检测中取得了成功,但在编码过程中平衡全局和局部特征方面面临挑战,导致特征表示不足。此外,这些方法通常依赖于单一解码器来解释来自多个编码器的信息,这可能无...多编码器和单解码器(multi encoder and single decoder,MESD)架构在变化检测中取得了成功,但在编码过程中平衡全局和局部特征方面面临挑战,导致特征表示不足。此外,这些方法通常依赖于单一解码器来解释来自多个编码器的信息,这可能无法充分利用所提供的丰富多样的信息,从而影响最终变化检测结果的准确性和精度。针对这些问题,提出一种交互式多编码器和多解码器网络,该网络利用交互式编码器来提取局部和全局特征,交互式编码器由卷积神经网络(convolutional neural network,CNN)和Transformer组成,并通过特征通信模块增强它们的交互。全局和局部差异解码器分别处理来自双时相图像的局部和全局特征,专注于特定类型的差异特征。最后,设计了空间-通道差异融合模块在空间和通道维度上自适应地融合局部和全局解码器获取的差异特征,以增强相关变化。与现有基于MESD网络的先进方法(ChangeForm)相比,该文所提算法在LEVIR-CD、WHU-CD和DESIF-CD数据集上分别获得了1.14%、5.68%和6.5%的F1分数提升。展开更多
文摘多编码器和单解码器(multi encoder and single decoder,MESD)架构在变化检测中取得了成功,但在编码过程中平衡全局和局部特征方面面临挑战,导致特征表示不足。此外,这些方法通常依赖于单一解码器来解释来自多个编码器的信息,这可能无法充分利用所提供的丰富多样的信息,从而影响最终变化检测结果的准确性和精度。针对这些问题,提出一种交互式多编码器和多解码器网络,该网络利用交互式编码器来提取局部和全局特征,交互式编码器由卷积神经网络(convolutional neural network,CNN)和Transformer组成,并通过特征通信模块增强它们的交互。全局和局部差异解码器分别处理来自双时相图像的局部和全局特征,专注于特定类型的差异特征。最后,设计了空间-通道差异融合模块在空间和通道维度上自适应地融合局部和全局解码器获取的差异特征,以增强相关变化。与现有基于MESD网络的先进方法(ChangeForm)相比,该文所提算法在LEVIR-CD、WHU-CD和DESIF-CD数据集上分别获得了1.14%、5.68%和6.5%的F1分数提升。