-
题名异态汉字识别方法研究
被引量:8
- 1
-
-
作者
王恺
李成学
王庆人
赵宏
张健
-
机构
南开大学计算机与控制工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2014年第10期2266-2281,共16页
-
基金
国家自然科学基金(61201424)
天津市自然科学基金(12JCYBJC10100)
中央高校基本科研业务费专项资金(65012131)
-
文摘
复杂图像文字识别是基于内容图像检索的一个重要研究方向.针对图像中的文字可能存在倾斜、光照不均、噪音干扰和边缘柔化等多种异态问题,提出一种有效的异态汉字识别方法,称作SC-HOG.首先,利用稀疏编码得到基向量和稀疏系数,通过重构图像滤除噪音、处理边缘柔化;然后,利用梯度方向直方图抽取复原图像的汉字边缘梯度特征,削弱倾斜和光照的影响;最后,将获取的特征向量送入分类器,实现异态汉字的识别.通过合成数据集和真实数据集两方面的实验来验证SC-HOG方法的有效性:前一方面实验结果表明,SC-HOG方法对于倾斜、光照不均、噪音干扰和边缘柔化等异态情况有较强的鲁棒性;后一方面实验结果表明,SC-HOG方法在原生数字图像和场景图像真实样本集上也能取得较好的结果.
-
关键词
稀疏编码
梯度方向直方图
增量线性决策分析
汉字识别
文档图像处理
-
Keywords
sparse coding (SC)
histograms of oriented gradients (HOG)
incremental linear discriminant analysis (ILDA)
Chinesecharacter recognition
document image processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-