针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer...针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer结构的全局语义特征修复模块,利用双向自回归机制与掩码语言模型(masked language modeling,MLM),提出改进的多头注意力全局语义壁画修复模块,提高对全局语义特征的修复能力.然后,构建了由门控卷积和残差模块组成的全局语义增强模块,增强全局语义特征一致性约束.最后,设计局部细节修复模块,采用大核注意力机制(large kernel attention,LKA)与快速傅里叶卷积提高细节特征的捕获能力,同时减少局部细节信息的丢失,提升修复壁画局部和整体特征的一致性.通过对敦煌壁画数字化修复实验,结果表明,所提算法修复性能更优,客观评价指标均优于比较算法.展开更多
现有图像修复技术通常很难为缺失区域生成视觉上连贯的内容,其原因是高频内容质量下降导致频谱结构的偏差,以及有限的感受野无法有效建模输入特征之间的非局部关系。为解决上述问题,提出一种融合双向感知Transformer与频率分析策略的图...现有图像修复技术通常很难为缺失区域生成视觉上连贯的内容,其原因是高频内容质量下降导致频谱结构的偏差,以及有限的感受野无法有效建模输入特征之间的非局部关系。为解决上述问题,提出一种融合双向感知Transformer与频率分析策略的图像修复网络(bidirect-aware Transformer and frequency analysis,BAT-Freq)。具体内容包括,设计了双向感知Transformer,用自注意力和n-gram的组合从更大的窗口捕获上下文信息,以全局视角聚合高级图像上下文;同时,提出了频率分析指导网络,利用频率分量来提高图像修复质量,并设计了混合域特征自适应对齐模块,有效地对齐并融合破损区域的混合域特征,提高了模型的细节重建能力。该网络实现空间域与频率域相结合的图像修复。在CelebA-HQ、Place2、Paris StreetView三个数据集上进行了大量的实验,结果表明,PSNR和SSIM分别平均提高了2.804 dB和8.13%,MAE和LPIPS分别平均降低了0.0158和0.0962。实验证明,该方法能够同时考虑语义结构的完善和纹理细节的增强,生成具有逼真感的修复结果。展开更多
针对多变量时序(Multivariate Time Series,MTS)分类中长序列数据难以捕捉时序特征的问题,提出一种基于双向稀疏Transformer的时序分类模型BST(Bidirectional Sparse Transformer),提高了MTS分类任务的准确度.BST模型使用Transformer框...针对多变量时序(Multivariate Time Series,MTS)分类中长序列数据难以捕捉时序特征的问题,提出一种基于双向稀疏Transformer的时序分类模型BST(Bidirectional Sparse Transformer),提高了MTS分类任务的准确度.BST模型使用Transformer框架,构建了一种基于活跃度得分的双向稀疏注意力机制.基于KL散度构建活跃度评价函数,并将评价函数的非对称问题转变为对称权重问题.据此,对原有查询矩阵、键值矩阵进行双向稀疏化,从而降低原Transformer模型中自注意力机制运算的时间复杂度.实验结果显示,BST模型在9个长序列数据集上取得最高平均排名,在临界差异图中领先第2名35.7%,对于具有强时序性的乙醇浓度数据集(Ethanol Concentration,EC),分类准确率提高30.9%.展开更多
文摘针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer结构的全局语义特征修复模块,利用双向自回归机制与掩码语言模型(masked language modeling,MLM),提出改进的多头注意力全局语义壁画修复模块,提高对全局语义特征的修复能力.然后,构建了由门控卷积和残差模块组成的全局语义增强模块,增强全局语义特征一致性约束.最后,设计局部细节修复模块,采用大核注意力机制(large kernel attention,LKA)与快速傅里叶卷积提高细节特征的捕获能力,同时减少局部细节信息的丢失,提升修复壁画局部和整体特征的一致性.通过对敦煌壁画数字化修复实验,结果表明,所提算法修复性能更优,客观评价指标均优于比较算法.
文摘现有图像修复技术通常很难为缺失区域生成视觉上连贯的内容,其原因是高频内容质量下降导致频谱结构的偏差,以及有限的感受野无法有效建模输入特征之间的非局部关系。为解决上述问题,提出一种融合双向感知Transformer与频率分析策略的图像修复网络(bidirect-aware Transformer and frequency analysis,BAT-Freq)。具体内容包括,设计了双向感知Transformer,用自注意力和n-gram的组合从更大的窗口捕获上下文信息,以全局视角聚合高级图像上下文;同时,提出了频率分析指导网络,利用频率分量来提高图像修复质量,并设计了混合域特征自适应对齐模块,有效地对齐并融合破损区域的混合域特征,提高了模型的细节重建能力。该网络实现空间域与频率域相结合的图像修复。在CelebA-HQ、Place2、Paris StreetView三个数据集上进行了大量的实验,结果表明,PSNR和SSIM分别平均提高了2.804 dB和8.13%,MAE和LPIPS分别平均降低了0.0158和0.0962。实验证明,该方法能够同时考虑语义结构的完善和纹理细节的增强,生成具有逼真感的修复结果。