针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,...针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,即U-Net对背景减除图像进行前景背景分割,最后采用全局最优阈值处理方法获得最终二值图像。实验结果表明,在2016和2017年国际文档图像二值化竞赛(DIBCO)中该算法的F值(F-measure,FM)、伪F值(pseudo F-measure,p-FM)、峰值信噪比(peak signal to noise ratio,PSNR)、距离倒数失真度量(distance reciprocal distortion,DRD)比性能次优的经典算法最高有5.58%、2.47%、0.86 dB、1.19%的性能提升。展开更多
文摘针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,即U-Net对背景减除图像进行前景背景分割,最后采用全局最优阈值处理方法获得最终二值图像。实验结果表明,在2016和2017年国际文档图像二值化竞赛(DIBCO)中该算法的F值(F-measure,FM)、伪F值(pseudo F-measure,p-FM)、峰值信噪比(peak signal to noise ratio,PSNR)、距离倒数失真度量(distance reciprocal distortion,DRD)比性能次优的经典算法最高有5.58%、2.47%、0.86 dB、1.19%的性能提升。
文摘车辆牌照识别VLPR(Vehicle license plate recognition)是智能交通系统ITS(Intelligent Trans-portation System)的重要部分,有着巨大的社会和经济效益,车辆牌照图像二值化方法的研究是VLPR中的关键技术,通常都采用经典的Bernsen算法和Otsu算法,但由于光照不均、摄像机畸变、曝光不足、动态范围太窄和车辆牌照被污染等原因,车辆牌照图像的质量往往不佳,存在严重伪影和字符边缘模糊,极大地影响了牌照图像二值化效果,Bernsen算法和Otsu算法也不能很好地克服上述问题。为此,提出了一种新的牌照图像二值化算法CASDA(Cluster Algorithm based on Spatial Distribution Analysis),能消除不均匀光照引起的伪影,极少出现笔划断裂等优点,二值化效果好。