-
题名基于傅里叶中心线预测的任意形状文本检测方法
- 1
-
-
作者
白昆
王哲
马龙
薛尧
李国栋
闫天
王晓田
-
机构
西安现代控制技术研究所
西安交通大学软件工程学院
西北工业大学无人系统技术研究院
-
出处
《液晶与显示》
北大核心
2025年第6期905-914,共10页
-
基金
国家自然科学基金(No.62106193)。
-
文摘
文本检测技术已经非常成熟,但由于文本框的几何编码限制,检测任意形状的文本仍然是文本检测任务中的主要挑战。在自然场景中,文本呈现出多种形状,并且真实场景中的文本受到拍摄角度、背景物体的物理变形以及文本本身固有曲率的影响,仅使用矩形边界框不足以包含不规则的文本实例。为了改进检测任意形状文本的问题,我们提出了一种利用频域中的傅里叶变换来构建文本特征的方法,通过预测文本的中心线来重建预测框。预测的文本中心线不仅有助于重建复杂形状的文本框,还可以通过中心线校正辅助后续的文本识别过程。本文方法在具有挑战性的任意形状文本检测数据集CTW1500、TotalText上取得了非常有竞争力的性能。
-
关键词
场景文本检测
深度神经网络
任意文本形状
-
Keywords
scene text detection
deep neural network
arbitrary text shape
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名双向特征融合的快速精确任意形状文本检测
被引量:5
- 2
-
-
作者
边亮
屈亚东
周宇
-
机构
北京航空航天大学电子信息工程学院
中国科学技术大学信息科学技术学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2021年第4期931-938,共8页
-
文摘
现有的基于分割的场景文本检测方法仍较难区分相邻文本区域,同时网络得到分割图后后处理阶段步骤复杂导致模型检测效率较低。为了解决此问题,该文提出一种新颖的基于全卷积网络的场景文本检测模型。首先,该文构造特征提取器对输入图像提取多尺度特征图。其次,使用双向特征融合模块融合两个平行分支特征的语义信息并促进两个分支共同优化。之后,该文通过并行地预测缩小的文本区域图和完整的文本区域图来有效地区分相邻文本。其中前者可以保证不同的文本实例之间具有区分性,而后者能有效地指导网络优化。最后,为了提升文本检测的速度,该文提出一个快速且有效的后处理算法来生成文本边界框。实验结果表明:在相关数据集上,该文所提出的方法均实现了最好的效果,且比目前最好的方法在F-measure指标上最多提升了1.0%,并且可以实现将近实时的速度,充分证明了该方法的有效性和高效性。
-
关键词
场景文本检测
双向特征融合
多尺度特征
后处理复杂度
任意形状文本
-
Keywords
Scene text detection
Bi-directional feature fusion
Multi-scale feature
Post-processing complexity
Arbitrary-shaped texts
-
分类号
TN911.73
[电子电信—通信与信息系统]
-
-
题名文本中心像素重建实现任意形状的文本检测
被引量:1
- 3
-
-
作者
雷小唐
胡靖
-
机构
成都信息工程大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第8期148-156,共9页
-
基金
国家自然科学基金(61602065)
四川省科技厅重点研发项目(2021YFG0038)。
-
文摘
针对自然场景文本检测算法未能高效、准确地实现端到端的任意形状文本检测,提出了轻量型像素聚类文本核重建的文本检测算法,针对轻量型网络特征信息弱和感受野小的问题,设计了图像级上下文信息模块(imagelevel context module)来捕获全局图像信息和语义级上下文信息模块(semantic-level context module)学习目标区域信息,两者信息融合增强网络特征信息保证检测的准确性,为了有效区分相邻文本和定位弯曲文本,基于文本核启发将文字实例中心视为聚类中心,从核中心经过一次像素聚类重建完整的文字实例实现对任意形状文本的检测。方法在弯曲文本数据集Total-Text和CTW1500综合评分达到了84.1%和84.6%超过了最好的CARFT方法,检测速度42帧/s超过最优EAST的,有效地解决了检测形状文本的高效和准确性,在应用层面更加友好。
-
关键词
图像级上下文
语义级上下文
像素聚类
任意形状文本
文本核
-
Keywords
image-level context
semantic-level context
pixel aggregation
arbitrary shape text
kenerl method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-