-
题名改进FCENet的自然场景文本检测算法
- 1
-
-
作者
周燕
廖俊玮
刘翔宇
周月霞
曾凡智
-
机构
佛山科学技术学院计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第3期228-236,共9页
-
基金
国家自然科学基金(61972091)
广东省自然科学基金(2022A1515010101,2021A1515012639)
+2 种基金
广东省普通高校重点研究项目(2019KZDXM007,2020ZDZX3049)
佛山市科技创新项目(2020001003285)
广东省教育科学规划课题(2021GXJK445)。
-
文摘
针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模块。多尺度残差特征增强模块作为骨干网络顶层的残差分支,增强了特征金字塔结构自上而下的高层语义信息流动,提高了文本像素分类能力,有效减少误检现象。多尺度注意力特征融合模块使不同语义和尺度的特征能够更好地融合,结合自底向上的特征融合网络,有效避免文本过度分割并提高了弯曲文本的检测能力。实验结果表明,该方法在弯曲文本数据集CTW1500和Total-Text上的综合指标F值分别达到了86.2%和86.5%,相比原算法FCENet分别提升了1.1和0.7个百分点。
-
关键词
自然场景文本检测
特征融合
特征增强
注意力机制
fcenet
-
Keywords
scene text detection
feature fusion
feature enhancement
attention mechanism
fourier contour embedding network(fcenet)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-