-
题名一个新的脱机手写汉字数据库模型及其应用
被引量:15
- 1
-
-
作者
郭军
蔺志青
张洪刚
-
机构
北京邮电大学信息工程系
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2000年第5期115-116,共2页
-
基金
国家 8 63计划资助课题
-
文摘
本文提出一个新的脱机手写汉字数据库模型 .此模型的特点在于将汉字样本信息与其书写者信息结合起来 ,因而既可为开发手写汉字识别算法提供训练和测试样本 ,也可用于研究各类人员的文字书写特征 ,探讨文字书写的相关因素 .本文还介绍了一个应用此模型的实例HCL2 0 0 0 ,并利用HCL2 0 0 0研究了影响识别率的相关因素 。
-
关键词
手写汉字数据库
文字识别
书写特征
-
Keywords
database of handwritten Chinese characters
recognition of characters
writing features
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名HCL2000手写汉字数据库的更新及相关研究
被引量:4
- 2
-
-
作者
任俊玲
郭军
-
机构
北京邮电大学信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2005年第5期97-104,共8页
-
基金
教育部跨世纪人才基金和教育部重点科研项目资助(02029)
-
文摘
HCL2000是目前最具影响力的手写汉字数据库之一,基于研究手写汉字规律的设计初衷,该数据库采用了以书写者为单位按文件形式组织和存放的方式。本文则从研究样本选择的应用角度出发,对HCL2000中的样本进行了重新组织,同时对该数据库中的错误进行了纠正,生成了一个新的手写汉字数据库HCL2004。文章最后基于HCL2004数据库和方向线素特征进行了有关训练样本数对识别性能影响的研究,给出了3755类大字符集情况下的最佳训练样本数为300的结论,同时还对识别过程中的样本选择问题进行了探讨。
-
关键词
人工智能
模式识别
HCL2000
手写汉字数据库
样本选择
HCL2004
-
Keywords
artificial intelligence
pattern recognition
HCL2000
handwritten Chinese characters database
pattern selection
HCL2004
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-