-
题名多字体印刷藏文字符识别
被引量:20
- 1
-
-
作者
王华
丁晓青
-
机构
清华大学电子工程系
-
出处
《中文信息学报》
CSCD
北大核心
2003年第6期47-52,共6页
-
基金
国家自然科学基金资助项目 (6 0 2 4 10 0 5 )
-
文摘
藏文字符识别系统是中文多文种信息处理系统的重要组成部分 ,但至今国内外的研究基本处于空白。本文提出了一种基于统计模式识别的多字体印刷藏文字符识别方法 :从字符轮廓中抽取方向线素特征 ,利用线性鉴别分析 (LDA)压缩降维后得到紧凑的字符特征向量。采用基于置信度分析的两级分类策略 ,设计了带偏差欧氏距离分类器 (EDD)完成高效的粗分类 ,细分类采用修正二次鉴别函数 (MQDF)。通过实验选取恰当的分类器参数后 ,在容量为 177,6 0 0字符 (30 0样本 /字符类 )的测试集上的识别率达到 99.79% 。
-
关键词
人工智能
模式识别
藏文字符识别
方向线素特征
线性鉴别分析
带偏差欧氏距离
修正二次鉴别函数
-
Keywords
artificial intelligence
pattern recognition
Tibetan character recognition
directional line element feature
LDA
EDD
MQDF
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名一种多字体印刷藏文字符识别方法
被引量:10
- 2
-
-
作者
王华
丁晓青
-
机构
清华大学电子工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第13期18-20,共3页
-
基金
国家自然科学基金资助项目(60241005)
-
文摘
提出了一种完整的多字体印刷藏文字符识别方法:先提取输入字符的方向线素特征组成特征向量,然后采用两级分类策略判定字符类别。该方法在训练集和测试集上的识别率分别达到99.73%和99.44%,证明了其有效性。
-
关键词
藏文字符识别
方向线素特征
带偏差欧氏距离
-
Keywords
Tibetan character recognition
Directional line element feature
Euclidean distance with deviation
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-