-
题名双分支跨级特征融合的自然场景文本检测
被引量:1
- 1
-
-
作者
刘光辉
张钰敏
孟月波
占华
-
机构
西安建筑科技大学信息与控制工程学院
-
出处
《智能系统学报》
CSCD
北大核心
2023年第5期1079-1089,共11页
-
基金
国家自然科学基金项目(52278125)
陕西省重点研发计划(2021SF-429)。
-
文摘
现有的场景文本检测方法在处理任意形状文本时,由于复杂背景的影响会造成文本区域定位不准确、相邻文本漏检误检的问题,基于此提出一种双分支跨级特征融合的自然场景文本检测方法。首先,以Resnet50为主干网络提取初始特征,设计跨级特征分布增强模块(cross-level feature distribution enhancement module,CFDEM),增强跨级特征文本信息的交互性,提高特征的表达能力;然后,为自适应地选择过滤非文本或冗余特征,降低误检率和漏检率,提出自适应融合策略(adaptive fusion strategy,AFS),利用双分支结构加强不同维度特征之间的联系,优化融合过程;最后,预测阶段采用可微分二值化的方法来生成文本检测结果。所提方法在ICDAR2015、ICDAR2017、Total-Text、CTW1500数据集上进行消融实验,实验结果表明该方法能准确定位文本区域,克服文本漏检误检影响。
-
关键词
文本检测
任意形状
跨级特征分布增强
自适应融合
双分支
空间维度
通道维度
可微分二值化
-
Keywords
text detection
arbitrarily shaped
cross-level feature distribution enhancement
adaptive fusion
double branch
spatial dimension
channel dimension
differentiable binarization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-