-
题名基于深度学习的场景文字识别技术研究
- 1
-
-
作者
陈志宇
司占军
朱新雨
-
机构
天津科技大学轻工科学与工程学院
天津科技大学人工智能学院
-
出处
《印刷与数字媒体技术研究》
CAS
北大核心
2024年第3期237-243,291,共8页
-
文摘
基于深度学习的场景文字识别技术(Scene Text Recognition,STR)应用广泛但性能尚需提升。针对现有的STR技术对小目标文字识别不准确和中文、中英文混合准确率低的问题,通过改进模型增加104×104的特征尺度,用Focal Loss和GIOU Loss作为损失函数来优化目标检测框,将卷积块注意力模块(Convolutional Block Attention Module,CBAM)嵌入到卷积层中,使网络在特定位置和通道上更加关注目标,抑制其余复杂背景信息以此来提高模型的文字检测能力;分析中文的文字特征,对CRNN的特征提取网络改进优化,提高了原有模型对中文、中英文混合识别的准确性。实验结果表明,通过对文字检测与识别模型和算法的改进优化,大大提高了场景文字识别技术的准确性和鲁棒性。
-
关键词
深度学习
场景文字识别技术
图像处理
目标检测
文字识别
-
Keywords
Deep learning
Scene Text Recognition technology
Image processing
Target detection
Text recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TS801.3
[轻工技术与工程]
-