基于PSENet的自然场景文字检测网络改进被引量：3

Improvement of Natural Scene Text Detection Network Based on PSENet

在线阅读下载PDF

导出

摘要由于自然场景中的图像背景复杂、文字排列不规则、光照条件不确定等因素,文字检测难度较大,且传统检测方法的效果并不理想。在研究文字分割检测方法PSENet(Progressive Scale Expansion Network)的基础上,提出了一种针对自然场景文字检测的改进方法。该方法由卷积神经网络提取特征模块,再通过渐进式规模扩张对文字区域进行分割检测。改进点主要是使用高精度的语义分割网络RefineNet(Refinement Network),对卷积网络特征提取模块进行优化,且增加较多的残差连接及链式池化,提高网络对文字区域的检测精度。通过对数据集ICDAR2015的实验结果对比,表明所提出的改进算法在精度方面略高于改进前,且能更好地解决文字粘连问题。 Due to the problematic scene background,irregular arrangement of text,and uncertain lighting conditions in natural scenes,text detection is difficult,and the traditional detection method is not ideal.In the study of the text segmentation detection method Progressive Scale Expansion Network(PSENet),an improved method for text detection in a natural scene is proposed.The improved model mainly uses the convolutional neural network to extract feature modules and performs segmentation detection on the text area through progressive scale expansion.The improvement points mainly uses a high-precision semantic segmentation network(RefineNet),optimizing the volume and network feature extraction modules,adding more residual connections and chain pooling,and improving the network's detection accuracy of the text area.Comparing the experimental results on the data set(ICDAR2015),the proposed improved algorithm is slightly more accurate than the previous algorithm and can better solve the problem of text conglutination.

作者施漪涵仝明磊 SHI Yihan;TONG Minglei(School of Electronics and Information Engineering,Shanghai University of Electric Power,Shanghai 200090,China)

机构地区上海电力大学电子与信息工程学院

出处《上海电力大学学报》 CAS 2021年第1期73-77,共5页 Journal of Shanghai University of Electric Power

关键词文字检测图像分割特征融合 text detection image segmentation feature fusion

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TP389.1 [自动化与计算机技术—计算机系统结构]

作者简介通信作者:仝明磊(1976—),男,博士,副教授。主要研究方向为利用人工智能技术的三维视觉重建(Visual Slam的核心技术)。E-mail:tongminglei@gmail.com。

引文网络
相关文献

参考文献3

1杨宏志,庞宇,王慧倩.基于改进Faster R-CNN的自然场景文字检测算法[J].重庆邮电大学学报（自然科学版）,2019,31(6):876-884. 被引量：19
2余若男,黄定江,董启文.基于深度学习的场景文字检测研究进展[J].华东师范大学学报（自然科学版）,2018(5):1-16. 被引量：7
3林泓,卢瑶瑶.聚焦难样本的区分尺度的文字检测方法[J].浙江大学学报（工学版）,2019,53(8):1506-1516. 被引量：4

二级参考文献5

1杨飞.自然场景图像中的文字检测综述[J].电子设计工程,2016,24(24):165-168. 被引量：12
2任智慧,徐浩煜,封松林,周晗,施俊.基于LSTM网络的序列标注中文分词法[J].计算机应用研究,2017,34(5):1321-1324. 被引量：69
3周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1838
4周成伟.基于卷积神经网络的自然场景中数字识别[J].计算机技术与发展,2017,27(11):101-105. 被引量：16
5吴昊,平鹏,孙立博,秦文虎.基于改进LRCN模型的驾驶行为图像序列识别方法[J].江苏大学学报（自然科学版）,2018,39(3):303-308. 被引量：8

共引文献26

1田芙荣,刘静静(指导),陈方苇.基于CNN的文字识别系统设计[J].浙江树人大学学报（自然科学版）,2019,0(3):12-17. 被引量：1
2钱国华,程芳芳,朱孝慈,丁力,岳友,陆一洲,牛丹.电梯内异常行为检测系统设计[J].工业控制计算机,2019,32(11):91-92. 被引量：7
3顾佳晨,樊登旺,孙玲,向江波,吴冰.机器视觉算法与CRNN网络相结合的热轧钢卷号识别模型开发[J].冶金自动化,2020,44(6):30-34. 被引量：4
4曹杰,陈锐,吴应双.人工智能技术在电网智能化检修中的应用探索[J].电工技术,2020(24):62-64. 被引量：6
5徐畅,王道元,李敬兆,陈梓华.矿用设备智能安全监测与预知维护系统[J].工矿自动化,2021,47(3):79-82. 被引量：3
6蔡中祥,孙建伟.融合指针网络的新闻文本摘要模型[J].小型微型计算机系统,2021,42(3):462-466. 被引量：15
7杜刚,戴晶,张晨,杜雪涛.不良文字图片识别技术研究[J].电信工程技术与标准化,2021,34(6):32-37. 被引量：1
8贾瑞祺,杜海鹏,孔雪,赵慧琳.基于边缘计算口罩佩戴智能系统的设计与实现[J].现代电子技术,2021,44(15):49-53. 被引量：5
9李玥,束鑫,常锋.基于改进EAST的场景文本检测算法[J].计算机与数字工程,2021,49(9):1753-1757. 被引量：3
10彭祥云,陈黎.安防视频时间戳同步检测方法研究[J].计算机技术与发展,2021,31(11):195-201.

同被引文献8

1林泓,卢瑶瑶.聚焦难样本的区分尺度的文字检测方法[J].浙江大学学报（工学版）,2019,53(8):1506-1516. 被引量：4
2赵龙,李飞,王伟峰.基于PSENet和CRNN的身份证识别[J].现代计算机,2020,26(34):78-82. 被引量：3
3徐绪堪,周泽聿.基于多尺度BiLSTM-CNN的微信推文的情感分类模型及应用研究[J].情报科学,2021,39(5):130-137. 被引量：24
4赵鹏,徐本朋,闫石,刘政怡.基于双分支特征融合的场景文本检测方法[J].控制与决策,2021,36(9):2179-2186. 被引量：5
5马冬梅,李鹏辉,黄欣悦,张倩,杨鑫.改进DeepLabV3的高效语义分割[J].计算机工程与科学,2022,44(4):737-745. 被引量：17
6彭栋,支世尧,李盛达,杨鹏.改进PSENet的自然场景文本检测方法[J].计算机时代,2022(6):89-92. 被引量：1
7辜瑞帆,李祥,任维民.基于ResNet50改进模型的图像分类研究[J].现代电子技术,2023,46(4):107-112. 被引量：11
8刘健,陈亮.基于YOLOv4的学生行为识别研究[J].沈阳理工大学学报,2023,42(3):16-21. 被引量：2

引证文献3

1彭栋,支世尧,李盛达,杨鹏.改进PSENet的自然场景文本检测方法[J].计算机时代,2022(6):89-92. 被引量：1
2李晓磊,茹慧英,李超.基于改进的PSENet自然场景文本检测[J].长江信息通信,2023,36(9):6-8.
3宋建辉,佟悦,刘晓阳,赵亚威.改进特征提取模块的场景文本检测方法[J].通信与信息技术,2024(1):96-100.

二级引证文献1

1李晓磊,茹慧英,李超.基于改进的PSENet自然场景文本检测[J].长江信息通信,2023,36(9):6-8.

1樊华,刘前程,瞿小阳,谢小春.烟包印刷纸盒粘连问题分析及应对策略[J].印刷工业,2020(5):59-60.
2谭建豪,殷旺,刘力铭,王耀南.引入全局上下文特征模块的DenseNet孪生网络目标跟踪[J].电子与信息学报,2021,43(1):179-186. 被引量：6
3郎贵林,郎泮.基于尺度可扩展网络算法的研究[J].中国宽带,2020(11):86-86.
4王春山,周冀,吴华瑞,滕桂法,赵春江,李久熙.改进Multi-scale ResNet的蔬菜叶部病害识别[J].农业工程学报,2020,36(20):209-217. 被引量：47
5张红梅,李浩然,张向利.基于重要性池化的层级图表示学习方法[J].桂林电子科技大学学报,2020,40(4):300-304. 被引量：2
6赵圆圆,施圣贤.融合多尺度特征的光场图像超分辨率方法[J].光电工程,2020,47(12):54-64. 被引量：10
7葛立,李骥,刘毅,王未,冯敏涛.一种新型高可靠性箭上配电控制器设计[J].遥测遥控,2020,41(6):46-50.
8王宇杰.基于机器视觉的塑料制品外观缺陷检测[J].合成树脂及塑料,2021,38(1):93-96. 被引量：10
9姜栋栋.《段注》引申假借实例溯源[J].汉字文化,2020(24):8-10.

上海电力大学学报

2021年第1期

浏览历史

内容加载中请稍等...

基于PSENet的自然场景文字检测网络改进被引量：3

参考文献3

二级参考文献5

共引文献26

同被引文献8

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于PSENet的自然场景文字检测网络改进 被引量：3

参考文献3

二级参考文献5

共引文献26

同被引文献8

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于PSENet的自然场景文字检测网络改进被引量：3