期刊文献+
共找到220篇文章
< 1 2 11 >
每页显示 20 50 100
基于DSP的版面分析和OCR识别的原理及实现 被引量:5
1
作者 刘建胜 汪同庆 +1 位作者 王贵新 居琰 《仪器仪表学报》 EI CAS CSCD 北大核心 2003年第6期577-580,共4页
随着光学字符识别 (OCR)技术广泛应用于人口普查、银行票据、各类报表等表格文档自动处理中 ,大大提高了表格文档的处理效率和精度 ,节省了人力物力和财力。 OCR识别系统通常采用扫描仪获取表格文档的原始图像 ,由计算机进行版面分析和... 随着光学字符识别 (OCR)技术广泛应用于人口普查、银行票据、各类报表等表格文档自动处理中 ,大大提高了表格文档的处理效率和精度 ,节省了人力物力和财力。 OCR识别系统通常采用扫描仪获取表格文档的原始图像 ,由计算机进行版面分析和字符识别。这里提出了基于 DSP的 OCR识别仪 ,采用接触式图像传感器摄取文档的原始图像 ,数字信号处理器(DSP)实现版面分析和字符识别。将识别结果输入到计算机中进行后处理。这样一台计算机可以联结多台识别仪 ,大大降低了 OCR识别系统的成本 。 展开更多
关键词 光学字符识别 DSP 版面分析 ocr 表格文档自动处理
在线阅读 下载PDF
一种基于Google的OCR结果校对新方法 被引量:8
2
作者 颜建强 高新波 《计算机学报》 EI CSCD 北大核心 2014年第6期1261-1267,共7页
为了提高OCR识别率,许多校对算法被提出用作后处理.这些方法利用自然语言规律统计大量的语料库进行语法判断.由于语料库规模有限且无法及时更新,导致一些网络新词、专用名词等常被错误处理.为此,文中将传统的语料库和Google知识库相结合... 为了提高OCR识别率,许多校对算法被提出用作后处理.这些方法利用自然语言规律统计大量的语料库进行语法判断.由于语料库规模有限且无法及时更新,导致一些网络新词、专用名词等常被错误处理.为此,文中将传统的语料库和Google知识库相结合,利用Google知识库获得网络新词等出现的频率,建立N-Gram模型,利用词语间的接续关系进行查错,再借助Google的拼写校对功能和词语之间的可信度进行改错.相比传统的方法,该方法的语料库源于互联网,对一些新词有更好的校对效果,更适合图像中嵌入的文字信息识别结果的校正. 展开更多
关键词 ocr 校对 语料库 GOOGLE 纠错
在线阅读 下载PDF
OCR性能测试的分布式软件测试系统 被引量:2
3
作者 许静 刘杰 +1 位作者 庞博 王庆人 《计算机工程》 CAS CSCD 北大核心 2006年第8期79-81,共3页
系统的性能测试需要进行全数据集合的回归测试,才能得到准确的性能指标。测试过程需要大数据量、长时间,所以自动测试成为必然的选择。该文设计了网络环境下的分布式自动测试系统,应用于软件系统的性能测试。并以OCR软件的测试为例,介... 系统的性能测试需要进行全数据集合的回归测试,才能得到准确的性能指标。测试过程需要大数据量、长时间,所以自动测试成为必然的选择。该文设计了网络环境下的分布式自动测试系统,应用于软件系统的性能测试。并以OCR软件的测试为例,介绍了该系统的具体功能实现。 展开更多
关键词 性能测试 分布式系统 ocr
在线阅读 下载PDF
基于霍夫变换的铭牌OCR图像旋转矫正方法 被引量:14
4
作者 张勇红 《电测与仪表》 北大核心 2015年第8期125-128,共4页
在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character... 在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character Recognition,OCR)准确率的方法:首先对原始图像进行二值化,进而获得铭牌的轮廓,再采用基于霍夫变换的方法获得铭牌中的水平线段,通过计算得到线段的水平倾斜角,利用此倾角对图像进行还原。实验结果表明,该方法能快速地计算图像的倾斜角度,提高了OCR识别准确率且准确率可达95%以上。 展开更多
关键词 ocr 字符识别 霍夫变换 旋转矫正
在线阅读 下载PDF
文本数字化图像OCR识别的准确度测度实验与提高 被引量:11
5
作者 臧国全 《图书情报知识》 CSSCI 北大核心 2010年第3期62-67,共6页
基于英国国家图书馆的Reshelp和Burney两个古旧英文报纸数字化项目,作者对文本型数字图像的OCR识别的准确度进行测试实验,结果显示整体准确度不高,且从高到低依次为字符、单词、重要单词、大写字母开头的重要单词。然后,将OCR识别周期... 基于英国国家图书馆的Reshelp和Burney两个古旧英文报纸数字化项目,作者对文本型数字图像的OCR识别的准确度进行测试实验,结果显示整体准确度不高,且从高到低依次为字符、单词、重要单词、大写字母开头的重要单词。然后,将OCR识别周期划分为数字扫描对象的获取、数字图像的生产、数字图像的处理和文本识别等四个阶段,分析每个阶段影响准确度的因素,探讨提高准确度的具体措施。 展开更多
关键词 ocr识别 准确度测试 信息资源数字化
在线阅读 下载PDF
基于OCR光学字符识别的翻译优化方法 被引量:10
6
作者 王晓艺 高挺挺 《激光杂志》 北大核心 2020年第12期156-160,共5页
以转化并翻译纸张等载体上文本资料为数字化信息为目标,提出一种基于OCR光学字符识别的翻译优化方法。利用具备摄像功能的设备拍摄含待翻译字符的图像,图像预处理时采用区域灰度差生长算法和叠加灰度值方式判断原始图像中背景信息和表... 以转化并翻译纸张等载体上文本资料为数字化信息为目标,提出一种基于OCR光学字符识别的翻译优化方法。利用具备摄像功能的设备拍摄含待翻译字符的图像,图像预处理时采用区域灰度差生长算法和叠加灰度值方式判断原始图像中背景信息和表格线条,去除原始图像中非字符像素干扰,得到二值化文本图像;图像分割时采用基于改进FCM聚类算法的图像分割方法,利用小波多尺度图像框架,引入时效性函数,降低二值化文本图像分割计算量,充分考虑相邻域信息,解决图像分割缺陷及干扰,获取二值化文本图像单个字符或单词;依据一阶Minkowski距离实现分割后的图像特征分类后,利用后处理方式结合上下文信息展开特征分类结果的进一步处理,提升翻译准确度。实验结果表明:所提方法可实现文字的精准翻译,应用效果较好。 展开更多
关键词 ocr 光学字符 识别 翻译 优化 图像
在线阅读 下载PDF
基于OCR的纵向文字校对的研究与实现 被引量:1
7
作者 李成城 白涛 +1 位作者 赵述芳 钟义信 《计算机应用研究》 CSCD 北大核心 2006年第4期234-236,共3页
提出一种基于OCR识别的文字纵向校对的实现方法,在文字信息处理、图像显示和校对过程中提出了自己的算法和策略,对数组结构及其读写方法进行了较细致的分析。以汉字的纵向校对为例,实验表明该方法具有很快的计算速度,对一个有经验的校... 提出一种基于OCR识别的文字纵向校对的实现方法,在文字信息处理、图像显示和校对过程中提出了自己的算法和策略,对数组结构及其读写方法进行了较细致的分析。以汉字的纵向校对为例,实验表明该方法具有很快的计算速度,对一个有经验的校对人员而言,通过纵校和横校的结合可以使差错率控制在万分之三以内。 展开更多
关键词 ocr 文字处理 纵向校对
在线阅读 下载PDF
西文OCR后处理中的有限自动机模型 被引量:2
8
作者 王恺 靳简明 王庆人 《计算机工程与应用》 CSCD 北大核心 2004年第23期26-29,共4页
在西文OCR中,从候选结果中挑选最佳结果的后处理操作是必不可少的,并且利用单词拼写检查进行后处理是完全可行的。但是,以往的方法分别在不同程度上具有低可靠性和局限性。为此,该文提出将有限自动机模型应用于西文OCR后处理中,该方法... 在西文OCR中,从候选结果中挑选最佳结果的后处理操作是必不可少的,并且利用单词拼写检查进行后处理是完全可行的。但是,以往的方法分别在不同程度上具有低可靠性和局限性。为此,该文提出将有限自动机模型应用于西文OCR后处理中,该方法有效地将拼写检查和识别结果信息结合起来,克服了以往方法中存在的低可靠性和局限性,并通过实验验证了该方法的有效性。以识别后处理辅助识别,错误率从0.79%降到0.59%;以识别后处理和系统后处理结合辅助识别,错误率降低到0.55%。 展开更多
关键词 字符串匹配 有限自动机 光学字符识别 文档图像处理 光学字符识别 ocr 文字信息电子化
在线阅读 下载PDF
我国民族语言文献文本数字化识别问题——基于OCR及其工具 被引量:5
9
作者 范俊军 刘贤娴 《暨南学报(哲学社会科学版)》 CSSCI 北大核心 2024年第6期31-45,共15页
我国少数民族语言文献数量庞大,文字种类繁多,内容涵盖政治、经济、法律、历史、文学、艺术、宗教、天文、地理、医药等领域,是中华民族文化知识的重要组成部分。构建各民族文献文本数据,使之应用于自然语言处理和人工智能,能有效促进... 我国少数民族语言文献数量庞大,文字种类繁多,内容涵盖政治、经济、法律、历史、文学、艺术、宗教、天文、地理、医药等领域,是中华民族文化知识的重要组成部分。构建各民族文献文本数据,使之应用于自然语言处理和人工智能,能有效促进中华优秀传统知识创新性传承,促进知识社会化,是对各民族语言古文献和现代书报刊进行文字识别和文本转换数据构建的基础。国内早期OCR技术虽然解决了几种主要少数民族文字识别的问题,但因字符为非Unicode基本集编码而弃用。当前OCR技术已能较好识别蒙、藏、维、哈、朝等文种文献,但在处理我国汉文与少数民族文字混排图像文本时仍然效果不佳。因此应推进少数民族语言文献OCR识别技术创新。我国少数民族语言文献现行活态文字有十多种,其中非拉丁字系的文字有11种,OCR技术应重点解决这类少数民族语言字系的抄本、刻版和铅字印刷文本,以及汉文与民族文字混排文本的识别问题,研发开放的多功能工具和平台。在此基础上,进一步开展少数民族语言文献文本大规模数据构建,以促进我国语言科学研究和自然语言处理的创新发展。 展开更多
关键词 少数民族语言 民族文献 文本识别 ocr 数据构建 数字人文
在线阅读 下载PDF
OCR下的改进SIFT人脸识别算法 被引量:5
10
作者 霍春宝 杨闯 +2 位作者 佟智波 杨红喆 王丹丹 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2021年第4期378-382,共5页
针对传统的SIFT人脸识别算法存在特征维数高、匹配计算量和难度大的问题,采用OCR技术中的非均匀网格的方式对人脸图像进行区域划分,引入旋转无关的等价模式的LTP特征对SIFT关键点进行描述并对比实验.研究结果表明:改进后的SIFT人脸识别... 针对传统的SIFT人脸识别算法存在特征维数高、匹配计算量和难度大的问题,采用OCR技术中的非均匀网格的方式对人脸图像进行区域划分,引入旋转无关的等价模式的LTP特征对SIFT关键点进行描述并对比实验.研究结果表明:改进后的SIFT人脸识别算法降低了特征的维数,增加了对旋转、光照变化、噪声干扰等影响因素的鲁棒性.研究结论初步突破了传统SIFT人脸识别算法,有助于从OCR技术中寻求提高识别率,降低匹配计算的复杂程度的方法. 展开更多
关键词 ocr技术 均匀网格 人脸识别技术 LTP算法 SIFT算法
在线阅读 下载PDF
OCR技术在会计信息系统中的应用流程 被引量:6
11
作者 王光明 严红艳 《财会通讯(上)》 北大核心 2005年第1期65-66,共2页
关键词 ocr技术 会计信息系统 应用流程 光学字符识别
在线阅读 下载PDF
基于OCR的拼写校正系统 被引量:3
12
作者 赵莉 《兵工自动化》 2010年第9期92-94,共3页
针对光学字符识别(Optical Character Recognition,OCR)过程中出现的英文字母识别错误问题,通过分析其出错原因,提出一种将拼写错误、OCR错误规则和编辑距离法相结合的校正算法,并实现了拼写校正系统最重要的2项功能:拼写检查和拼写校... 针对光学字符识别(Optical Character Recognition,OCR)过程中出现的英文字母识别错误问题,通过分析其出错原因,提出一种将拼写错误、OCR错误规则和编辑距离法相结合的校正算法,并实现了拼写校正系统最重要的2项功能:拼写检查和拼写校正。其中,拼写检查模块采用了查字典技术;校正过程中则采用了编辑距离法。通过选取5种常用字体的打印档的辨识情况,测试了算法的有效性。实例证明,校正后的识别率都提高了2%~4%。 展开更多
关键词 拼写校正 光学字符识别 编辑距离 ocr距离
在线阅读 下载PDF
档案数字化过程中OCR技术的应用 被引量:22
13
作者 许呈辰 《档案管理》 北大核心 2011年第1期38-40,共3页
简单介绍档案数字化过程中的OCR技术,分析该技术的优势和在档案数字化工作中的独特应用,如,创新著录标引方式;实现真正的全文检索;支持双层PDF技术;拓宽档案用户利用面等。在此基础上,从OCR软件选择、参数设置、图像处理、人工校对等方... 简单介绍档案数字化过程中的OCR技术,分析该技术的优势和在档案数字化工作中的独特应用,如,创新著录标引方式;实现真正的全文检索;支持双层PDF技术;拓宽档案用户利用面等。在此基础上,从OCR软件选择、参数设置、图像处理、人工校对等方面探讨提高OCR识别率的各种方法,以期使从事档案数字化工作的人员有所借鉴,提高档案数字化工作的效率。 展开更多
关键词 档案 数字化 ocr
在线阅读 下载PDF
集成汉英OCR系统识别中文名片 被引量:2
14
作者 靳简明 《计算机工程与应用》 CSCD 北大核心 2002年第7期253-256,共4页
汉英双语混排识别是构造中文自动文档图像处理系统时常会遇到的一个问题。只有采用一种有效的方法集成现有汉英识别引擎,才可能高质量地识别混排文档。该文应用适当干预和多层次语言判断的汉英OCR系统集成原则,集成OCR系统识别中文名片... 汉英双语混排识别是构造中文自动文档图像处理系统时常会遇到的一个问题。只有采用一种有效的方法集成现有汉英识别引擎,才可能高质量地识别混排文档。该文应用适当干预和多层次语言判断的汉英OCR系统集成原则,集成OCR系统识别中文名片。实验数据表明,利用该原则构造的系统确实能有效集成汉英识别引擎,在纯中文识别率为89.86%,纯英文识别率为91.20%的情况下,使名片最终总体识别率达到了93.45%,较好地解决了汉英混排名片的识别问题。 展开更多
关键词 系统集成 自动名片处理系统 图像处理 名片识别 汉英混排识别 ocr系统 中文名片 计算机
在线阅读 下载PDF
基于Tesseract-OCR的燃气表自动识别研究 被引量:8
15
作者 冯玉田 侯玖廷 顾乐易 《电子测量技术》 2019年第21期82-86,共5页
设计了摄像直读式燃气表自动抄表系统,通过图像处理和OCR技术对燃气表读数进行识别。采用在图像HSV空间进行直方图均衡和中值滤波对燃气表图像进行预处理,提高了适应性。在用Tesseract光学字符识别引擎进行字符特征提取中,提出了基于颜... 设计了摄像直读式燃气表自动抄表系统,通过图像处理和OCR技术对燃气表读数进行识别。采用在图像HSV空间进行直方图均衡和中值滤波对燃气表图像进行预处理,提高了适应性。在用Tesseract光学字符识别引擎进行字符特征提取中,提出了基于颜色和轮廓的定位算法分割燃气表读数区域,使得系统具有更好的稳定性。识别中针对燃气表字体训练Tesseract,从而实现了较高的识别正确率。实验中,通过对多个品牌的燃气表进行测试,识别准确率达到98.7%。本文设计的燃气表自动识别系统具有识别准确率高、鲁棒性好、识别速度快等特点,可为燃气表自动抄表或自助抄表提供有效的技术途径。 展开更多
关键词 燃气表自动抄表 图像处理 图像识别 Tesseract-ocr
在线阅读 下载PDF
一个实用的多字体多字号印刷汉字OCR系统 被引量:2
16
作者 刘传憬 《计算机应用研究》 CSCD 1995年第4期57-59,共3页
目前,印刷汉字OCR技术已逐渐成熟,正走入实用化阶段。本文从实用角度出发,介绍了我们独立开发的一个多字体多字号印刷汉字OCR系统,其中着重描述了多字体多字号的中西文混排文本的行、字切分技术,以及粗分类使用的"轮廓特征... 目前,印刷汉字OCR技术已逐渐成熟,正走入实用化阶段。本文从实用角度出发,介绍了我们独立开发的一个多字体多字号印刷汉字OCR系统,其中着重描述了多字体多字号的中西文混排文本的行、字切分技术,以及粗分类使用的"轮廓特征法"和细分类使用的"关键区域法",最后给出该系统的测试结果和达到的技术指标。 展开更多
关键词 印刷汉字 ocr系统 汉字ocr 汉字识别
在线阅读 下载PDF
OCR在油库考评系统中的应用
17
作者 齐林 周艳霞 +1 位作者 张晓静 魏世泽 《河北科技大学学报》 CAS 2001年第3期73-76,共4页
油库考评系统是作者新近开发的用软件对表格进行识别及处理的系统。本文主要介绍在系统开发过程中使用汇集了全部考评信息的成绩卡 (二维字表图像 ) ,经过光电扫描把它转换成 1幅光栅格式的数字图像送入计算机缓存 ,随即采用我国高科技... 油库考评系统是作者新近开发的用软件对表格进行识别及处理的系统。本文主要介绍在系统开发过程中使用汇集了全部考评信息的成绩卡 (二维字表图像 ) ,经过光电扫描把它转换成 1幅光栅格式的数字图像送入计算机缓存 ,随即采用我国高科技863计划的成果——汉字识别软件 ,对缓存的数字图像进行字表识别 ,转换成文本格式的数据文件以及后续处理过程。 展开更多
关键词 扫描控件 ocr 字表识别 模糊识别
在线阅读 下载PDF
一种对表单型OCR系统的性能评价方法
18
作者 管聪慧 宣国荣 《小型微型计算机系统》 CSCD 北大核心 2003年第8期1495-1498,共4页
针对表单处理的 OCR系统是在实际中应用非常广泛的一类 .尽管在识别方面已经提出了很多种算法 ,但是对OCR系统性能的评价方法 ,无论经验的 ,还是理论的 ,却很少 .单字的识别率虽然能够衡量一个 OCR系统的识别性能 ,但是无法找出识别结... 针对表单处理的 OCR系统是在实际中应用非常广泛的一类 .尽管在识别方面已经提出了很多种算法 ,但是对OCR系统性能的评价方法 ,无论经验的 ,还是理论的 ,却很少 .单字的识别率虽然能够衡量一个 OCR系统的识别性能 ,但是无法找出识别结果的错误原因 .本文中提出的方法通过对表单型 OCR系统的识别结果进行统计 ,从统计结果中提取出性能评价参数 .这不仅能对整个系统的性能进行评价 。 展开更多
关键词 性能评价 字符识别 ocr 统计 表单型文档
在线阅读 下载PDF
通用OCR开发工具的设计
19
作者 王浩军 赵南元 邓钢轶 《计算机工程与应用》 CSCD 北大核心 2002年第21期133-136,共4页
提出了一个通用OCR开发工具的设想,用于各种文字的OCR软件的开发,它能够在使用者的干预下自动完成识别器的设计,大大减少文字识别软件开发的工作量。系统以决策树作为基本的判别器,并用多个决策树组成多方案识别系统。提出设计树和分类... 提出了一个通用OCR开发工具的设想,用于各种文字的OCR软件的开发,它能够在使用者的干预下自动完成识别器的设计,大大减少文字识别软件开发的工作量。系统以决策树作为基本的判别器,并用多个决策树组成多方案识别系统。提出设计树和分类器设计器的概念,分别用于决策树设计过程的控制和决策树节点中的分类器的设计。最后实现一个实验系统,验证了该文的设想和设计方案的可行性。 展开更多
关键词 通用ocr开发工具 设计 文字识别 决策树 设计树 自动设计 光学文字识别 计算机
在线阅读 下载PDF
图像几何校正在OCR文字识别中的应用 被引量:8
20
作者 秦旭光 徐爱功 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2006年第S2期64-66,共3页
针对在文字识别软件进行文字识别时,经常遇到扫描后存在几何变形图像生成的电子书籍难以进行文字识别的问题,提出了图像分块校正在OCR文字识别中的应用方法。利用VC++编程,分别采用图像的整体纠正方法和分块纠正方法对待识别电子书籍纠... 针对在文字识别软件进行文字识别时,经常遇到扫描后存在几何变形图像生成的电子书籍难以进行文字识别的问题,提出了图像分块校正在OCR文字识别中的应用方法。利用VC++编程,分别采用图像的整体纠正方法和分块纠正方法对待识别电子书籍纠正,然后对纠正后的电子书籍文字识别,经多次实验,效果显著并完全可以解决此类问题。 展开更多
关键词 几何校正 文字识别 ocr 整体纠正 分块纠正
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部