-
题名基于深度学习的自然场景文本检测综述
被引量:7
- 1
-
-
作者
连哲
殷雁君
云飞
智敏
-
机构
内蒙古师范大学计算机科学技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第3期16-27,共12页
-
基金
内蒙古自治区自然科学基金(2021LHMS06009)
内蒙古自治区高等学校科学研究项目(NJZZ21004)。
-
文摘
基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。
-
关键词
深度学习
计算机视觉
自然场景文本
文本检测
多方向文本检测
多尺度文本检测
-
Keywords
deep learning
computer vision
natural scene text
text detection
multi-directional text detection
multi-scale text detection
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-