-
题名基于生成对抗门控卷积网络的文档图像印章消除
- 1
-
-
作者
伍贵宾
杨宗元
熊永平
张兴
王伟
-
机构
北京邮电大学计算机学院(国家示范性软件学院)
华润数科人工智能实验室
-
出处
《计算机科学》
CSCD
北大核心
2024年第1期198-206,共9页
-
基金
国家电网公司总部科技项目(5500-202216134A-1-1-ZN)。
-
文摘
发票和文档上的印章严重影响文字识别的准确率,因此印章消除技术在文档识别和文档增强的预处理过程中发挥着重要作用。然而,现有的阈值分割方法和基于深度学习的方法存在印章消除不全以及会修改背景像素等问题。文中提出了一个两阶段式印章消除网络SealErase。第一阶段是一个用于生成包含印章位置信息的二值化掩膜的U型分割网络,第二阶段是一个用于进行精细化印章消除的修复网络。由于目前缺乏公开的用于印章消除的成对数据集,现有的方法无法设计像素级的评价指标来衡量生成图像的质量。并且,利用配对的训练集训练神经网络可以有效提高网络的性能。为此,文中兼顾真实场景的泛化性以及对噪声的鲁棒性构建了一个包含8000个样本的高仿真的印章消除数据集。其中的印章分为两种:真实文档图像中的印章和合成的印章。为了客观地评价SealErase的性能,文中设计了基于图像生成质量和被印章遮盖的字符识别准确率的综合评价指标用于评估SealErase网络的消除性能。在构建的印章消除数据集上对比了现有的印章消除模型,实验结果表明,SealErase网络在图像生成质量的评价指标中的峰值信噪比相比最先进的方法提升了26.79%,平均结构相似性指标提升了4.48%。经过SealErase网络进行印章消除后,被印章遮盖的字符识别准确率提高了38.86%。SealErase在真实场景下同样可以有效消除印章并保留被遮盖的文字。
-
关键词
印章消除
图像修复
印章生成
生成式对抗网络
门控卷积
SealErase
-
Keywords
Seal removal
Image inpainting
Seal synthesis
Generative adversarial networks
Gated Convolutions
SealErase
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名SealGAN:基于生成式对抗网络的印章消除研究
被引量:5
- 2
-
-
作者
李新利
邹昌铭
杨国田
刘禾
-
机构
华北电力大学控制与计算机工程学院
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2021年第11期2614-2622,共9页
-
文摘
发票是财务系统的重要组成部分.随着计算机视觉和人工智能技术的发展,出现了各种发票自动识别系统,但是发票上的印章严重影响了识别准确率.本文提出了一种用于自动消除发票印章的SealGAN网络. SealGAN网络是基于生成式对抗网络CycleGAN的改进,采用两个独立的分类器来取代原本的判别网络,从而降低单个分类器的分类要求,提高分类器的学习性能,并且结合ResNet和Unet两种结构构建下采样-精炼-上采样的生成网络,生成更加清晰的发票图像.同时提出了基于风格评价和内容评价的综合评价指标对SealGAN网络进行性能评价.实验结果表明,与CycleGAN-ResNet和CycleGAN-Unet网络相比较, SealGAN网络不仅能实现自动消除印章,而且还能更加清晰地保留印章下的发票内容,网络性能评价指标较高.
-
关键词
印章消除
生成式对抗网络
SealGAN
CycleGAN
评价指标
-
Keywords
Seal elimination
generative adversarial networks
SealGAN
CycleGAN
evaluation index
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
TP391.41
[自动化与计算机技术—计算机应用技术]
F275
[经济管理—企业管理]
-