-
题名基于多信息融合的中文手写地址字符串切分与识别
被引量:7
- 1
-
-
作者
付强
丁晓青
蒋焰
-
机构
智能技术与系统国家重点实验室清华大学电子工程系
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2008年第12期2916-2920,共5页
-
基金
国家自然科学基金(60472002)
西门子公司合作项目(20030829-24022SI202)资助课题
-
文摘
该文提出了一种有效的中文手写地址字符串的切分与识别方法。首先,利用笔划提取与笔划合并将字符串图像进行过切分,得到"字根"图像序列;然后综合利用几何信息、识别信息和语义信息挑选最优的"字根"合并路径,得到最优的切分结果及对应的最优识别结果。其中,几何信息是根据当前字符串自身的特点统计得到,因此可适应不同书写风格的字符串。识别信息由单字分类器给出,包括10个候选识别结果及其相应的置信度;单字分类器采用MQDF分类器。语义信息用基于字的bi-gram模型进行描述,模型参数是从包含18万条地址数据的数据库中统计得到的。用3000个实际的手写地址样本做试验,单字识别正确率达到88.28%。
-
关键词
地址识别
字符串切分
手写字符串识别
-
Keywords
Address recognition
Character string segmentation
Handwritten character string recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多分类器的无分割手写数字字符串识别算法
被引量:3
- 2
-
-
作者
任晓奎
丁鑫
陶志勇
何欣键
-
机构
辽宁工程技术大学电子与信息工程学院
阜新力兴科技有限责任公司
中国电网四川阿坝州电力有限责任公司
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第7期2222-2226,共5页
-
基金
辽宁省博士启动基金资助项目(20170520098)
辽宁省自然科学基金资助项目(2015020100)
+1 种基金
辽宁省普通高等教育本科教学改革研究项目(551610001095)
辽宁省教育厅一般项目(LJ2017QL013)。
-
文摘
手写体数字字符串识别常用于邮件自动分拣、银行票据和财务报表的录入中,针对其分割识别算法复杂度较高、准确率较低的问题,提出一种多分类器下无分割手写数字字符串识别算法。该算法的核心是采用四个分类器实现粘连字符串的无分割识别;将残差结构应用于Le Net-5网络,以增加网络深度,提高识别准确率,加快收敛速度;使用动态选择策略,以避免长度分类器误分类对识别结果的影响。实验结果表明,在NIST SD19一位数字和Synthetic数据集训练网络下,使用NIST SD19上长度为2、3、4、5、6的字符串验证网络,其识别准确率分别为99.3%、98.5%、98.1%、96.6%和97.2%。
-
关键词
图像处理
手写数字字符串识别
多分类器
无分割
动态选择
-
Keywords
image processing
handwritten digital string recognition
multi-classifier
no segmentation
dynamic selection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名词典驱动的联机手写日文病名识别研究
- 3
-
-
作者
梁建娟
朱碧兰
刘本永
中川正樹
-
机构
贵州大学计算机科学与信息学院
日本东京农工大学
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第20期116-118,共3页
-
文摘
研究了一种有效的词典驱动的联机手写日文病名识别方法。病名词典以树结构存储,包含21713个病名短语。在切分中,手写病名字符串通过分析相邻笔划之间的空间信息等特征被切分为原始的片段序列。连续的片段动态地合并为候选字符模式,不同的合并方式产生不同的候选字符序列,这样可构成一个切分候选网格。在识别过程中,结合病名词典匹配来限制候选字符模式的类别扩展,采用集束搜索策略来寻找到一条最优路径作为识别结果。用500个实际的手写病名样本做实验,平均每个病名的识别时间为0.87s,识别正确率为83.16%。
-
关键词
病名识别
词典驱动识别
手写字符串识别
集束搜索
-
Keywords
disease name recognition
lexicon driven recognition
handwritten character string recognition
beam search
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-