为了有效检测识别被篡改的古籍文字图像,提出一种可用于古籍文字图像篡改的检测识别模型MDAS-Net。首先在边缘监督分支中提出一种全新的特征融合方式即混合注意力块,以更好地提取图像中的多尺度目标信息;其次,针对边缘监督分支和噪声敏...为了有效检测识别被篡改的古籍文字图像,提出一种可用于古籍文字图像篡改的检测识别模型MDAS-Net。首先在边缘监督分支中提出一种全新的特征融合方式即混合注意力块,以更好地提取图像中的多尺度目标信息;其次,针对边缘监督分支和噪声敏感分支的特征融合设计一种特征传递模块E-2-N/N-2-E Help Block,促进2个分支间的信息交流,以得到更高质量的融合特征。为了验证模型的有效性,创建古籍图像篡改数据集,并联合篡改图像文本数据集(TTI)进行对比实验和消融实验。结果表明,MDAS-Net模型在古籍文字图像篡改区域检测效果良好,受试者工作特性曲线下的面积(AUC)达到了0.852,F_(1)值达到了0.784,并证明了MDAS-Net在检测古籍文字图像篡改方面的实用性。展开更多
通过研究,提出了一种基于不确定性建模的中文场景文本编辑(Chinese scene text editing,CSTE)方法,并发现了1种有效的技术解决方案.该方法通过不确定性引导的调整机制优化预测噪声,提升噪声估计准确性,从而增强生成文本的清晰度和结构...通过研究,提出了一种基于不确定性建模的中文场景文本编辑(Chinese scene text editing,CSTE)方法,并发现了1种有效的技术解决方案.该方法通过不确定性引导的调整机制优化预测噪声,提升噪声估计准确性,从而增强生成文本的清晰度和结构完整性.同时,通过过滤文本和图像特征中的无关信息,提高了跨模态对齐能力,实现了文本与背景纹理的融合.展开更多
文摘为了有效检测识别被篡改的古籍文字图像,提出一种可用于古籍文字图像篡改的检测识别模型MDAS-Net。首先在边缘监督分支中提出一种全新的特征融合方式即混合注意力块,以更好地提取图像中的多尺度目标信息;其次,针对边缘监督分支和噪声敏感分支的特征融合设计一种特征传递模块E-2-N/N-2-E Help Block,促进2个分支间的信息交流,以得到更高质量的融合特征。为了验证模型的有效性,创建古籍图像篡改数据集,并联合篡改图像文本数据集(TTI)进行对比实验和消融实验。结果表明,MDAS-Net模型在古籍文字图像篡改区域检测效果良好,受试者工作特性曲线下的面积(AUC)达到了0.852,F_(1)值达到了0.784,并证明了MDAS-Net在检测古籍文字图像篡改方面的实用性。
文摘通过研究,提出了一种基于不确定性建模的中文场景文本编辑(Chinese scene text editing,CSTE)方法,并发现了1种有效的技术解决方案.该方法通过不确定性引导的调整机制优化预测噪声,提升噪声估计准确性,从而增强生成文本的清晰度和结构完整性.同时,通过过滤文本和图像特征中的无关信息,提高了跨模态对齐能力,实现了文本与背景纹理的融合.