图文识别技术综述被引量：14

Overview of image and text recognition technology

在线阅读下载PDF

导出

摘要本文概括性的介绍了图文识别所涉及的技术。首先介绍了图文识别的背景知识,包括应用领域、技术难点及挑战和系统实施流程等;其次介绍了图文识别技术的预处理方法及流程,包括旋转校正、线检测、特征匹配、字符轮廓提取及分割、OCR识别流程;接着介绍了图文识别过程中常用的特征提取基础网络和检测网络,以及它们的场景适配问题;然后介绍了近年来出现的各种图文检测深度学习网络、图文识别深度学习网络、端到端图文检测与识别深度学习网络,并分析了各类检测和识别网络的网络架构、算法思路及其特点;最后介绍了公开的图文识别训练、测试数据集以及不同算法的性能比较。 This paper gives a general introduction for the technology of image to text recognition.Firstly,the background of the image to text recognition is introduced,including application scenarios、technical difficulties and challenges、and system implementation process.Secondly,the preprocessing methods and processes of image to text recognition technology are introduced,including rotation correction、line detection、feature matching、extraction and segmentation of the character contour、and the whole processing of the OCR(Optical Character Recognition).Thirdly,we introduce the basic feature extraction network and the detection network framework commonly used in the process of image to text recognition;also,we discuss about the problem of scene adaptation when they are applied to the task of image to text recognition.Then,we introduce the various text detection deep learning network,text recognition deep learning network,end-to-end text detection and recognition network that have emerged in recent years;at the same time,we analyze the algorithm ideas and characteristics of various detection and recognition networks.Finally,we list the open data sets used in the domain of image to text recognition and performance comparison of different algorithm.

作者牛小明毕可骏唐军 NIU Xiaoming;BI Kejun;TANG Jun(Sichuan Changhong Electric Co.,Ltd.,Software&Service Center,Mianyang 621000,China)

机构地区四川长虹电器股份有限公司

出处《中国体视学与图像分析》 2019年第3期241-256,共16页 Chinese Journal of Stereology and Image Analysis

关键词图文检测文本识别端到端识别 image to text detection text recognition end to end recognition

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

作者简介牛小明(1983-),男(汉),硕士,四川长虹电器股份有限公司资深专家。E-mail:xiaoming1.niu@changhong.com

引文网络
相关文献

参考文献3

1熊兴华.遗传算法及其在影像处理与分析中的应用[J].测绘学报,2004,33(2):187-187. 被引量：3
2娄震,胡钟山,杨静宇.支票自动处理系统中的图像处理及识别[J].南京理工大学学报,1999,23(3):273-277. 被引量：14
3张文增,陈强,都东,孙振国.直线检测的灰度投影积分方法[J].清华大学学报（自然科学版）,2005,45(11):1446-1449. 被引量：22

二级参考文献7

1张黔,胡庆,杨静宇,蒋韧.统计和结构模式识别方法结合的多特征印鉴真伪鉴别方法[J].计算机学报,1995,18(3):190-198. 被引量：12
2Jain R, Kasturi R, Schunck B G. Machine Vision [M]. New York:McGraw-Hill Inc, 1995.
3章毓晋.图像工程-图像处理与分析 [M].北京:清华大学出版社,1999..
4Canny J F. A computational approach to edge detection [J]. IEEE Trans Pattern Analysis and Machine Intelligence, 1986, 8(6):679-698.
5Ballard D H. Generalizing the Hough transform to detect arbitrary shapes [J]. Pattern Recognition, 1981, 13(2):111-122.
6Tupin F, Maitre H, Mangin J, et al. Detection of linear features in SAR images:Application to road network extraction [J]. IEEE Trans Geoscience Remote Sensing, 1998, 36(2):434-453.
7Fischler M A, Tenenbaum J M, Wolf H C. Detection of roads and linear structures in low resolution aerial imagery using a multisource knowledge integration technique [J]. Comput Graph Image Processing, 1981, 15(3):201-223.

共引文献36

1张重阳,陈强,徐勇,杨静宇.支票中手写体数字串的提取与分割[J].计算机工程,2005,31(3):163-165. 被引量：1
2朱国春.要明星企业家更要明星下属[J].人才资源开发,2005(12):95-95.
3陈增照,何秀玲,杨扬,董才林.基于多特征融合的票据分类技术及应用[J].计算机工程与应用,2006,42(9):202-204. 被引量：1
4赵丽艳,王静,李京辉,邵温.一个后督支票处理系统[J].微计算机信息,2006,22(11X):40-42.
5张文增,陈强,都东,孙振国,张国贤.基于三维视觉的焊接机器人轨迹跟踪[J].清华大学学报（自然科学版）,2007,47(8):1270-1273. 被引量：18
6郑哲伟,张文增,陈强,都东.图像焊缝检测的圆形子窗口多步GPI方法[J].焊接学报,2007,28(8):77-80.
7钱稷,钱东平,周娟.基于虚拟仪器的农产品“身份证”数字识别系统[J].农机化研究,2007,29(12):160-162. 被引量：1
8余艳梅,罗代升.一种基于频域滤波的图纸背景坐标网格去除技术[J].四川大学学报（工程科学版）,2008,40(1):144-147. 被引量：2
9石勇涛,胡钢.一种改进的虹膜定位算法[J].计算机与数字工程,2008,36(1):32-33. 被引量：2
10刘进,闫利,李德仁.利用点对分析法检测线段[J].武汉大学学报（信息科学版）,2008,33(3):314-317. 被引量：1

同被引文献97

1李训虎.刑事司法人工智能的包容性规制[J].中国社会科学,2021(2):42-62. 被引量：129
2秦宗文.证据标准的双维分析:基准与动力[J].中国刑事法杂志,2021(3):87-103. 被引量：27
3贺小荣,陈雪洁.中国文化旅游70年:发展历程、主要经验与未来方向[J].南京社会科学,2019(11):1-9. 被引量：20
4Qingqing WANG,Ye HUANG,Wenjing JIA,Xiangjian HE,Michael BLUMENSTEIN,Shujing LYU,Yue LU.FACLSTM:ConvLSTM with focused attention for scene text recognition[J].Science China(Information Sciences),2020,63(2):35-48. 被引量：13
5付其运.人工智能非主体性前提下侵权责任承担机制研究[J].法学杂志,2021(4):83-90. 被引量：26
6龚祥瑞,李克强.法律工作的计算机化[J].法学杂志,1983,4(3):16-20. 被引量：51
7郎波,黄静,危辉.利用多层视觉网络模型进行图像局部特征表征的方法[J].计算机辅助设计与图形学学报,2015,27(4):703-712. 被引量：10
8刘泉宝,刘永清.从思维科学看人工智能的研究[J].计算机科学,1994,21(5):9-12. 被引量：7
9曾庆元,赵国锡.浅谈条形码技术在物流管理中的应用[J].柴油机设计与制造,2006,14(4):54-56. 被引量：8
10计库.二维条码与一维条码、RFID比较[J].中国自动识别技术,2008(3):47-47. 被引量：11

引证文献14

1王德青,吾守尔·斯拉木,许苗苗.场景文字识别技术研究综述[J].计算机工程与应用,2020,56(18):1-15. 被引量：20
2刘斌,程方毅,龚德文.图像自动识别技术在物流自动化中的研究与应用现状分析[J].机电工程技术,2020,49(10):104-109. 被引量：6
3产世兵,刘宁钟,沈家全.一种轻量级的不规则场景文本识别模型[J].计算机技术与发展,2020,30(11):20-24. 被引量：3
4袁伟,郭欣,田红楠.病例文字识别与提取方法综述[J].机电产品开发与创新,2020,33(6):138-140. 被引量：1
5顾佳晨,樊登旺,孙玲,向江波,吴冰.机器视觉算法与CRNN网络相结合的热轧钢卷号识别模型开发[J].冶金自动化,2020,44(6):30-34. 被引量：4
6吴博世,田英爱,王浩翔.汉语言难检字读音查询app研究与开发[J].科学咨询,2020(53):38-39. 被引量：1
7吴鑫磊,陶青川,张畅.基于DBNet网络的瓶盖文字目标检测[J].现代计算机,2021,27(14):47-53. 被引量：3
8窦莹.污染源自动监测监控系统智能化探讨[J].皮革制作与环保科技,2021,2(16):135-136. 被引量：1
9颜家云,张慧源,李晨,彭联贴.光学识别技术在机车检修记录单电子化中的应用[J].控制与信息技术,2021(6):77-83. 被引量：2
10张永洪,孙幼政,高名岩,王洋博,席梦丹.百度OCR在房地一体户籍档案数字化中的自动著录研究[J].地矿测绘,2021,37(4):30-33. 被引量：3

二级引证文献60

1光鼎立,郑天意,王健,肖昌炎.基于改进Mask TextSpotter V3模型的钢卷标号识别[J].智能安全,2022,1(2):26-33.
2袁伟,郭欣,田红楠.病例文字识别与提取方法综述[J].机电产品开发与创新,2020,33(6):138-140. 被引量：1
3陈太阳.基于卷积神经网络多特征融合的复杂背景字符识别[J].电脑知识与技术,2021,17(10):192-193. 被引量：2
4杨越可,柳莫停.图像文字识别关键技术综述研究[J].数码设计,2021,10(12):273-274.
5吴鑫磊,陶青川,张畅.基于DBNet网络的瓶盖文字目标检测[J].现代计算机,2021,27(14):47-53. 被引量：3
6李佳琪.基于OpenCV的生产日期字符识别研究[J].电子产品世界,2021,28(7):87-90. 被引量：1
7张开生,王泽.基于磁性纤维的加密纸张图像采集与识别研究[J].中国造纸,2021,40(6):64-70. 被引量：4
8宫法明,刘芳华,李厥瑾,宫文娟.基于深度学习的场景文本检测与识别[J].计算机系统应用,2021,30(8):179-185. 被引量：7
9熊炜,艾美慧,杨荻椿,李利荣,刘敏,王娟,曾春艳.基于深度学习的场景文本检测算法研究[J].光电子．激光,2021,32(7):728-734. 被引量：2
10刘斌,龙健宁,程方毅,龚德文.基于卷积神经网络的物流货物图像分类研究[J].机电工程技术,2021,50(12):79-82. 被引量：3

1黄莉苹.趣味识字教学措施在小学语文教学中的应用分析[J].读天下（综合）,2019(31):0065-0065.
2叶硕,褚钰,王祎,李田港.语音识别中声学模型研究综述[J].计算机技术与发展,2020,30(3):181-186. 被引量：5
3唐三立,程战战,钮毅,雷鸣.一种面向结构化文本图像识别的深度学习模型[J].杭州电子科技大学学报（自然科学版）,2020,40(2):45-51. 被引量：1
4王来兵.基于混合深层网络与云平台计算的车牌识别系统[J].重庆科技学院学报（自然科学版）,2020,22(1):71-75. 被引量：1
5唐琳.基于机器学习的文本倾向性分析特征选择研究[J].赤峰学院学报（自然科学版）,2020,36(1):36-38. 被引量：2
6徐璐,程栋,刘春华,于贺军,付惠成,薛秀娟,王瑗瑗,王静.新乡市艾滋病检测实验室网络建设及管理[J].实用检验医师杂志,2019,0(4):252-254. 被引量：2
7李全全.Python OpenCv在智慧党建人脸识别中的应用[J].中国有线电视,2020,0(2):167-171. 被引量：2
8张哲远,陈立辉,张新阳.基于SVM的岩石镜下鉴定模式探究[J].科技视界,2019,0(36):27-28.
9林成哲,任培花,马永.基于个性化线路定制的景区导游APP设计与实现[J].软件,2020,41(3):42-46.
10尹慧,花嵘,郭宁,尹韬.基于深度学习的分布式安全日志分析方法[J].软件,2020,41(3):272-277. 被引量：6

中国体视学与图像分析

2019年第3期

浏览历史

内容加载中请稍等...

图文识别技术综述被引量：14

参考文献3

二级参考文献7

共引文献36

同被引文献97

引证文献14

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

图文识别技术综述 被引量：14

参考文献3

二级参考文献7

共引文献36

同被引文献97

引证文献14

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

图文识别技术综述被引量：14