期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
改进FCENet的自然场景文本检测算法
1
作者
周燕
廖俊玮
+2 位作者
刘翔宇
周月霞
曾凡智
《计算机工程与应用》
CSCD
北大核心
2024年第3期228-236,共9页
针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模...
针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模块。多尺度残差特征增强模块作为骨干网络顶层的残差分支,增强了特征金字塔结构自上而下的高层语义信息流动,提高了文本像素分类能力,有效减少误检现象。多尺度注意力特征融合模块使不同语义和尺度的特征能够更好地融合,结合自底向上的特征融合网络,有效避免文本过度分割并提高了弯曲文本的检测能力。实验结果表明,该方法在弯曲文本数据集CTW1500和Total-Text上的综合指标F值分别达到了86.2%和86.5%,相比原算法FCENet分别提升了1.1和0.7个百分点。
展开更多
关键词
自然场景文本检测
特征融合
特征增强
注意力机制
FCENet
在线阅读
下载PDF
职称材料
多层次MSER自然场景文本检测
被引量:
11
2
作者
唐有宝
卜巍
邬向前
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2016年第6期1134-1140,共7页
提出一种新的基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,其由候选区域的提取和文本检测组成.在候选区域提取过程中,采用多层次MSER区域提取方法:通过对原始图像进行多个颜色空间变换和多尺度放缩得到多个变换后的图像,...
提出一种新的基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,其由候选区域的提取和文本检测组成.在候选区域提取过程中,采用多层次MSER区域提取方法:通过对原始图像进行多个颜色空间变换和多尺度放缩得到多个变换后的图像,采用多个阈值对其进行MSER区域检测,并将检测到的区域作为候选区域用于文本检测.检测过程中,对候选区域提取手工设计的底层特征和基于卷积神经网络(CNN)的深层特征,训练一个随机森林回归器对特征进行分类得到字符区域,再将其合并成单词区域,并进行相似的特征提取和分类,从而得到最终的文本检测结果.使用2个标准的数据库(ICDAR2011和ICDAR2013)对提出的方法进行性能评价,F指标在ICDAR2011和ICDAR2013上均为0.79,表明了所提出的自然场景文本检测方法的有效性.
展开更多
关键词
自然场景文本检测
多层次最大稳定极值区域(MSER)
卷积神经网络(CNN)
随机森林回归器
在线阅读
下载PDF
职称材料
基于自适应色彩聚类和上下文信息的自然场景文本检测
被引量:
3
3
作者
邹北骥
郭建京
+2 位作者
朱承璋
杨文君
徐子雯
《电子学报》
EI
CAS
CSCD
北大核心
2018年第6期1436-1444,共9页
自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适...
自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率.然后,利用文本中字符成行出现的性质,设计一种基于上下文信息的字符验证策略,既能保证较高字符召回率,也能有效移除非文本字符.最后,合并字符构建文本行,并通过后处理得到文本检测结果.在ICDAR2013公共数据集上的实验结果表明:本文分别获得74.17%的召回率,83.40%的准确率和78.52%的F得分.与其他文本检测方法相比,本文获得了较好的文本检测性能,说明本文方法的优越性.
展开更多
关键词
自然场景文本检测
自适应色彩聚类
上下文信息
自学习策略
在线阅读
下载PDF
职称材料
基于对象建议算法的自然场景文本检测
被引量:
6
4
作者
哈恩楠
吉立新
高超
《计算机应用研究》
CSCD
北大核心
2018年第2期624-627,636,共5页
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征...
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征和边缘梯度特征,并将文本和非文本区域的区分问题转换成一个二值标记问题,通过最小化能量函数寻找最佳标记;最后,通过均值漂移聚类寻找文本区域的中心生成文本行。经实验证明,本算法在常用的自然场景文本检测数据集上速度得到了提高,并且一定程度上解决了传统最稳定极值区域算法对光照敏感的问题,获得了较高的查全率。
展开更多
关键词
对象建议算法
最稳定极值区域
贝叶斯分类器
自然场景文本检测
在线阅读
下载PDF
职称材料
面向自然场景文本检测的改进NMS算法
被引量:
9
5
作者
杨有为
周刚
《计算机工程与应用》
CSCD
北大核心
2022年第1期204-208,共5页
近些年来,卷积神经网络算法在自然场景文本检测效果上较传统算法已经有了很大提升,但如何有效处理神经网络输出层候选框仍然值得研究。非极大值抑制算法(non-maximum suppression,NMS)通过选择最高置信度候选框作为检测结果,往往容易对...
近些年来,卷积神经网络算法在自然场景文本检测效果上较传统算法已经有了很大提升,但如何有效处理神经网络输出层候选框仍然值得研究。非极大值抑制算法(non-maximum suppression,NMS)通过选择最高置信度候选框作为检测结果,往往容易对较长文本以及混叠文本区域检测失效。考虑到该问题,可以将候选框集合进行排序滤波与融合计算,得到更准确的候选框,有效减少上述检测失效的情况。这种方法,可以直接嵌入原有方法中,而不需要改变网络结构或者增加任何训练量。通过在公开数据集上进行实验,对比其他方法,该方法有较大优势。
展开更多
关键词
自然场景文本检测
卷积神经网络
非极大值抑制
排序滤波
融合计算
在线阅读
下载PDF
职称材料
嵌入注意力机制的自然场景文本检测方法
被引量:
8
6
作者
杨锶齐
易尧华
+1 位作者
汤梓伟
王新宇
《计算机工程与应用》
CSCD
北大核心
2021年第24期185-191,共7页
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法。利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改...
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法。利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围。实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中。
展开更多
关键词
自然场景文本检测
特征金字塔网络
区域建议网络
注意力机制
在线阅读
下载PDF
职称材料
多方向自然场景文本检测
被引量:
6
7
作者
何思楠
郭永金
张利
《计算机应用研究》
CSCD
北大核心
2018年第7期2193-2196,共4页
针对自然场景图像背景复杂和文本方向不确定的问题,提出一种多方向自然场景文本检测的方法。该方法利用颜色增强的最大稳定极值区域(C-MSER)方法对图像中的字符候选区域进行提取,并利用启发式规则和LIBSVM分类器对非字符区域进行消除;...
针对自然场景图像背景复杂和文本方向不确定的问题,提出一种多方向自然场景文本检测的方法。该方法利用颜色增强的最大稳定极值区域(C-MSER)方法对图像中的字符候选区域进行提取,并利用启发式规则和LIBSVM分类器对非字符区域进行消除;然后设计位置颜色模型将被误滤除的字符找回,并利用字符区域中心进行拟合估计文本行倾斜角度;最后通过一个CNN分类器得到精确的结果。该算法在两个标准数据集上(ICDAR2011和ICDAR2013)测试,得到F-score分别为0.81和0.82,证明了该方法的有效性。
展开更多
关键词
自然场景文本检测
颜色增强的最大稳定极值区域
特征提取
多方向估计
分类器
在线阅读
下载PDF
职称材料
基于注意力机制与深度多尺度特征融合的自然场景文本检测
被引量:
3
8
作者
李雨
闫甜甜
+1 位作者
周东生
魏小鹏
《图学学报》
CSCD
北大核心
2023年第3期473-481,共9页
针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更...
针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更具判别力的特征表示;然后设计深度多尺度特征融合模块,将不同尺度的特征信息进行交互,自适应地学习不同尺度特征图对应的权重矩阵,用于融合文本实例在不同尺度特征图上具有判别力的特征信息,从而获得更具鲁棒性的多尺度融合特征图;最后利用自适应的二值化后处理模块生成更加精确的文本区域边界框。为评估其有效性,大量实验在ICDAR2015,ICDAR2013和CTW1500数据集上进行验证,结果表明该方法相较于其他先进的检测方法取得了有竞争力的检测结果,展现出良好的鲁棒性和泛化能力。
展开更多
关键词
自然场景文本检测
注意力机制
多尺度特征融合
二值化
自适应
在线阅读
下载PDF
职称材料
自然场景文本快速检测识别方法
9
作者
燕天
《探测与控制学报》
CSCD
北大核心
2023年第3期126-133,共8页
针对基于卷积循环神经网络或实例分割的自然场景文本图像检测识别方法结构复杂、实时性差、鲁棒性低的问题,提出基于改进Faster RCNN和高斯混合模型(GMM)的文本图像快速检测识别方法。该方法首先使用改进的Faster RCNN模型进行单字符检...
针对基于卷积循环神经网络或实例分割的自然场景文本图像检测识别方法结构复杂、实时性差、鲁棒性低的问题,提出基于改进Faster RCNN和高斯混合模型(GMM)的文本图像快速检测识别方法。该方法首先使用改进的Faster RCNN模型进行单字符检测识别并求出图中文本区域的数量,然后使用高斯混合模型进行单字符聚类并构造出候选的多边形文本框,最后使用重定义的置信度公式筛选出适当的文本区域边框,并输出边框内的字符标签序列。公共数据集的测试结果表明,该方法具有良好的鲁棒性和实时性。
展开更多
关键词
自然场景文本检测
识别
改进的Faster
RCNN
高斯混合模型
鲁棒性
实时性
在线阅读
下载PDF
职称材料
基于随机区域扩张算法的多方向文本检测
10
作者
哈恩楠
吉立新
高超
《计算机工程与设计》
北大核心
2018年第4期1095-1099,共5页
针对传统文本检测方法只能定位水平文本或近水平文本的问题,提出随机区域扩张算法,定位任意方向文本。使用最稳定极值区域算法对输入图片预处理,得到文本备选区域;设计3个尺度不变、方向鲁棒的特征,通过贝叶斯算法融合多特征生成概率映...
针对传统文本检测方法只能定位水平文本或近水平文本的问题,提出随机区域扩张算法,定位任意方向文本。使用最稳定极值区域算法对输入图片预处理,得到文本备选区域;设计3个尺度不变、方向鲁棒的特征,通过贝叶斯算法融合多特征生成概率映射,使用条件随机场模型标记文本和非文本区域;提出随机区域扩张算法,将属于相同文本行的字符连接在一起,寻找包围文本行的最小区域,定位多方向文本。实验结果表明,该算法在自然场景文本经典数据集上取得了较好的效果,能够较好定位任意方向的文本。
展开更多
关键词
最稳定极值区域
贝叶斯算法
随机区域扩张算法
自然场景文本检测
多方向
文本
定位
在线阅读
下载PDF
职称材料
一种车辆识别代号检测和识别的弱监督学习方法
被引量:
2
11
作者
曹志
尚丽丹
尹东
《光电工程》
CAS
CSCD
北大核心
2021年第2期78-90,共13页
车辆识别代号对于车辆年检具有重要的意义。由于缺乏字符级标注,无法对车辆识别代号进行单字符风格校验。针对该问题,设计了一种单字符检测和识别框架,并对此框架提出了一种无须字符级标注的弱监督学习方法。首先,对VGG16-BN各个层次的...
车辆识别代号对于车辆年检具有重要的意义。由于缺乏字符级标注,无法对车辆识别代号进行单字符风格校验。针对该问题,设计了一种单字符检测和识别框架,并对此框架提出了一种无须字符级标注的弱监督学习方法。首先,对VGG16-BN各个层次的特征信息进行融合,获得具有单字符位置信息与语义信息的融合特征图;其次,设计了一个字符检测分支和字符识别分支的网络结构,用于提取融合特征图中的单字符位置和语义信息;最后,利用文本长度和单字符类别信息,对所提框架在无字符级标注的车辆识别代号数据集上进行弱监督训练。实验结果表明,本文方法在车辆识别代号测试集上得到的检测Hmean数值达到0.964,单字符检测和识别准确率达到95.7%,具有很强的实用性。
展开更多
关键词
卷积神经网络
弱监督学习
自然场景文本检测
自然
场景
文本
识别
车辆识别代号
在线阅读
下载PDF
职称材料
题名
改进FCENet的自然场景文本检测算法
1
作者
周燕
廖俊玮
刘翔宇
周月霞
曾凡智
机构
佛山科学技术学院计算机系
出处
《计算机工程与应用》
CSCD
北大核心
2024年第3期228-236,共9页
基金
国家自然科学基金(61972091)
广东省自然科学基金(2022A1515010101,2021A1515012639)
+2 种基金
广东省普通高校重点研究项目(2019KZDXM007,2020ZDZX3049)
佛山市科技创新项目(2020001003285)
广东省教育科学规划课题(2021GXJK445)。
文摘
针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模块。多尺度残差特征增强模块作为骨干网络顶层的残差分支,增强了特征金字塔结构自上而下的高层语义信息流动,提高了文本像素分类能力,有效减少误检现象。多尺度注意力特征融合模块使不同语义和尺度的特征能够更好地融合,结合自底向上的特征融合网络,有效避免文本过度分割并提高了弯曲文本的检测能力。实验结果表明,该方法在弯曲文本数据集CTW1500和Total-Text上的综合指标F值分别达到了86.2%和86.5%,相比原算法FCENet分别提升了1.1和0.7个百分点。
关键词
自然场景文本检测
特征融合
特征增强
注意力机制
FCENet
Keywords
scene text detection
feature fusion
feature enhancement
attention mechanism
Fourier contour embedding network(FCENet)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
多层次MSER自然场景文本检测
被引量:
11
2
作者
唐有宝
卜巍
邬向前
机构
哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学媒体技术与艺术系
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2016年第6期1134-1140,共7页
基金
国家自然科学基金资助项目(61073125
61350004)
+1 种基金
中央高校基本科研业务费专项资金资助项目(HIT.NSRIF.2013091
HIT.HSS.201407)
文摘
提出一种新的基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,其由候选区域的提取和文本检测组成.在候选区域提取过程中,采用多层次MSER区域提取方法:通过对原始图像进行多个颜色空间变换和多尺度放缩得到多个变换后的图像,采用多个阈值对其进行MSER区域检测,并将检测到的区域作为候选区域用于文本检测.检测过程中,对候选区域提取手工设计的底层特征和基于卷积神经网络(CNN)的深层特征,训练一个随机森林回归器对特征进行分类得到字符区域,再将其合并成单词区域,并进行相似的特征提取和分类,从而得到最终的文本检测结果.使用2个标准的数据库(ICDAR2011和ICDAR2013)对提出的方法进行性能评价,F指标在ICDAR2011和ICDAR2013上均为0.79,表明了所提出的自然场景文本检测方法的有效性.
关键词
自然场景文本检测
多层次最大稳定极值区域(MSER)
卷积神经网络(CNN)
随机森林回归器
Keywords
scene text detection
multi-level maximally stable extremal regions(MSER)
convolutional neural network(CNN)
random forest regressor
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于自适应色彩聚类和上下文信息的自然场景文本检测
被引量:
3
3
作者
邹北骥
郭建京
朱承璋
杨文君
徐子雯
机构
中南大学信息科学与工程学院
中南大学眼科医学影像处理研究中心
出处
《电子学报》
EI
CAS
CSCD
北大核心
2018年第6期1436-1444,共9页
基金
国家自然科学基金(No.61573380
No.61702559)
+1 种基金
湖南省科技计划项目(No.2017WK2074)
中南大学创新创业师生共创项目(No.2017gczd016)
文摘
自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率.然后,利用文本中字符成行出现的性质,设计一种基于上下文信息的字符验证策略,既能保证较高字符召回率,也能有效移除非文本字符.最后,合并字符构建文本行,并通过后处理得到文本检测结果.在ICDAR2013公共数据集上的实验结果表明:本文分别获得74.17%的召回率,83.40%的准确率和78.52%的F得分.与其他文本检测方法相比,本文获得了较好的文本检测性能,说明本文方法的优越性.
关键词
自然场景文本检测
自适应色彩聚类
上下文信息
自学习策略
Keywords
natural scene text detection
adaptive color clustering
context information
self-learning strategy
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于对象建议算法的自然场景文本检测
被引量:
6
4
作者
哈恩楠
吉立新
高超
机构
国家数字交换系统工程技术研究中心
出处
《计算机应用研究》
CSCD
北大核心
2018年第2期624-627,636,共5页
基金
国家科技支撑计划资助项目(2014BAH30B01)
国家自然科学基金资助项目(61379151)
文摘
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征和边缘梯度特征,并将文本和非文本区域的区分问题转换成一个二值标记问题,通过最小化能量函数寻找最佳标记;最后,通过均值漂移聚类寻找文本区域的中心生成文本行。经实验证明,本算法在常用的自然场景文本检测数据集上速度得到了提高,并且一定程度上解决了传统最稳定极值区域算法对光照敏感的问题,获得了较高的查全率。
关键词
对象建议算法
最稳定极值区域
贝叶斯分类器
自然场景文本检测
Keywords
object proposals
MSER
Bayesian classifier
natural scene text detection
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向自然场景文本检测的改进NMS算法
被引量:
9
5
作者
杨有为
周刚
机构
新疆大学信息科学与工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2022年第1期204-208,共5页
基金
新疆自然科学基金青年基金项目(2016D01C079)。
文摘
近些年来,卷积神经网络算法在自然场景文本检测效果上较传统算法已经有了很大提升,但如何有效处理神经网络输出层候选框仍然值得研究。非极大值抑制算法(non-maximum suppression,NMS)通过选择最高置信度候选框作为检测结果,往往容易对较长文本以及混叠文本区域检测失效。考虑到该问题,可以将候选框集合进行排序滤波与融合计算,得到更准确的候选框,有效减少上述检测失效的情况。这种方法,可以直接嵌入原有方法中,而不需要改变网络结构或者增加任何训练量。通过在公开数据集上进行实验,对比其他方法,该方法有较大优势。
关键词
自然场景文本检测
卷积神经网络
非极大值抑制
排序滤波
融合计算
Keywords
natural scene text detection
convolutional neural network(CNN)
non-maximum suppression(NMS)
order filtering
fusion computing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
嵌入注意力机制的自然场景文本检测方法
被引量:
8
6
作者
杨锶齐
易尧华
汤梓伟
王新宇
机构
武汉大学印刷与包装系
出处
《计算机工程与应用》
CSCD
北大核心
2021年第24期185-191,共7页
基金
国家科技重大专项(2017ZX01030102)。
文摘
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法。利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围。实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中。
关键词
自然场景文本检测
特征金字塔网络
区域建议网络
注意力机制
Keywords
natural scene text detection
feature pyramid network
region proposal network
attention mechanism
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
多方向自然场景文本检测
被引量:
6
7
作者
何思楠
郭永金
张利
机构
清华大学电子工程系
中国船舶工业系统工程研究院
出处
《计算机应用研究》
CSCD
北大核心
2018年第7期2193-2196,共4页
基金
国家自然科学基金重点项目(61132007)
文摘
针对自然场景图像背景复杂和文本方向不确定的问题,提出一种多方向自然场景文本检测的方法。该方法利用颜色增强的最大稳定极值区域(C-MSER)方法对图像中的字符候选区域进行提取,并利用启发式规则和LIBSVM分类器对非字符区域进行消除;然后设计位置颜色模型将被误滤除的字符找回,并利用字符区域中心进行拟合估计文本行倾斜角度;最后通过一个CNN分类器得到精确的结果。该算法在两个标准数据集上(ICDAR2011和ICDAR2013)测试,得到F-score分别为0.81和0.82,证明了该方法的有效性。
关键词
自然场景文本检测
颜色增强的最大稳定极值区域
特征提取
多方向估计
分类器
Keywords
natural scene text detection
color-enhanced maximally stable extremal region
feature extraction
multi-orientation estimation
classifier
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于注意力机制与深度多尺度特征融合的自然场景文本检测
被引量:
3
8
作者
李雨
闫甜甜
周东生
魏小鹏
机构
大连大学软件工程学院计算机辅助设计国家地方联合工程实验室
大连理工大学计算机科学与技术学院
出处
《图学学报》
CSCD
北大核心
2023年第3期473-481,共9页
基金
国家自然科学基金重点项目(U21A20491)
辽宁省中央引导地方科技发展专项(2021JH6/10500140)
+1 种基金
辽宁省高等学校创新团队支持计划项目(LT2020015)
大连市重点领域创新团队支持计划项目(2021RT06)。
文摘
针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更具判别力的特征表示;然后设计深度多尺度特征融合模块,将不同尺度的特征信息进行交互,自适应地学习不同尺度特征图对应的权重矩阵,用于融合文本实例在不同尺度特征图上具有判别力的特征信息,从而获得更具鲁棒性的多尺度融合特征图;最后利用自适应的二值化后处理模块生成更加精确的文本区域边界框。为评估其有效性,大量实验在ICDAR2015,ICDAR2013和CTW1500数据集上进行验证,结果表明该方法相较于其他先进的检测方法取得了有竞争力的检测结果,展现出良好的鲁棒性和泛化能力。
关键词
自然场景文本检测
注意力机制
多尺度特征融合
二值化
自适应
Keywords
natural scene text detection
attention mechanism
multi-scale feature fusion
binarization
adaptive
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
自然场景文本快速检测识别方法
9
作者
燕天
机构
轨道交通工程信息化国家重点实验室(中铁一院)
中国铁建BIM工程实验室(中铁一院)
出处
《探测与控制学报》
CSCD
北大核心
2023年第3期126-133,共8页
基金
中国铁建股份有限公司科研课题(2021-A02)
中铁第一勘察设计院集团有限公司科研课题(院科20-06)。
文摘
针对基于卷积循环神经网络或实例分割的自然场景文本图像检测识别方法结构复杂、实时性差、鲁棒性低的问题,提出基于改进Faster RCNN和高斯混合模型(GMM)的文本图像快速检测识别方法。该方法首先使用改进的Faster RCNN模型进行单字符检测识别并求出图中文本区域的数量,然后使用高斯混合模型进行单字符聚类并构造出候选的多边形文本框,最后使用重定义的置信度公式筛选出适当的文本区域边框,并输出边框内的字符标签序列。公共数据集的测试结果表明,该方法具有良好的鲁棒性和实时性。
关键词
自然场景文本检测
识别
改进的Faster
RCNN
高斯混合模型
鲁棒性
实时性
Keywords
natural scene text detection and recognition
improved Faster RCNN
GMM
robustness
real-time
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于随机区域扩张算法的多方向文本检测
10
作者
哈恩楠
吉立新
高超
机构
国家数字交换系统工程技术研究中心媒体大数据分析实验室
出处
《计算机工程与设计》
北大核心
2018年第4期1095-1099,共5页
基金
国家科技支撑计划基金项目(2014BAH30B01)
国家自然科学基金项目(61379151)
文摘
针对传统文本检测方法只能定位水平文本或近水平文本的问题,提出随机区域扩张算法,定位任意方向文本。使用最稳定极值区域算法对输入图片预处理,得到文本备选区域;设计3个尺度不变、方向鲁棒的特征,通过贝叶斯算法融合多特征生成概率映射,使用条件随机场模型标记文本和非文本区域;提出随机区域扩张算法,将属于相同文本行的字符连接在一起,寻找包围文本行的最小区域,定位多方向文本。实验结果表明,该算法在自然场景文本经典数据集上取得了较好的效果,能够较好定位任意方向的文本。
关键词
最稳定极值区域
贝叶斯算法
随机区域扩张算法
自然场景文本检测
多方向
文本
定位
Keywords
MSER
Bayesian algorithm
random area grow algorithm
natural scene text detection
multi-orientation text location
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种车辆识别代号检测和识别的弱监督学习方法
被引量:
2
11
作者
曹志
尚丽丹
尹东
机构
中国科学技术大学信息科学技术学院
中国科学技术大学中国科学院电磁空间信息重点实验室
出处
《光电工程》
CAS
CSCD
北大核心
2021年第2期78-90,共13页
基金
安徽省重点研究与开发计划项目(1804a09020049)。
文摘
车辆识别代号对于车辆年检具有重要的意义。由于缺乏字符级标注,无法对车辆识别代号进行单字符风格校验。针对该问题,设计了一种单字符检测和识别框架,并对此框架提出了一种无须字符级标注的弱监督学习方法。首先,对VGG16-BN各个层次的特征信息进行融合,获得具有单字符位置信息与语义信息的融合特征图;其次,设计了一个字符检测分支和字符识别分支的网络结构,用于提取融合特征图中的单字符位置和语义信息;最后,利用文本长度和单字符类别信息,对所提框架在无字符级标注的车辆识别代号数据集上进行弱监督训练。实验结果表明,本文方法在车辆识别代号测试集上得到的检测Hmean数值达到0.964,单字符检测和识别准确率达到95.7%,具有很强的实用性。
关键词
卷积神经网络
弱监督学习
自然场景文本检测
自然
场景
文本
识别
车辆识别代号
Keywords
convolutional neural network
weakly supervised learning
scene text detection
scene text recognition
vehicle identification number(VIN)
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
改进FCENet的自然场景文本检测算法
周燕
廖俊玮
刘翔宇
周月霞
曾凡智
《计算机工程与应用》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
多层次MSER自然场景文本检测
唐有宝
卜巍
邬向前
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2016
11
在线阅读
下载PDF
职称材料
3
基于自适应色彩聚类和上下文信息的自然场景文本检测
邹北骥
郭建京
朱承璋
杨文君
徐子雯
《电子学报》
EI
CAS
CSCD
北大核心
2018
3
在线阅读
下载PDF
职称材料
4
基于对象建议算法的自然场景文本检测
哈恩楠
吉立新
高超
《计算机应用研究》
CSCD
北大核心
2018
6
在线阅读
下载PDF
职称材料
5
面向自然场景文本检测的改进NMS算法
杨有为
周刚
《计算机工程与应用》
CSCD
北大核心
2022
9
在线阅读
下载PDF
职称材料
6
嵌入注意力机制的自然场景文本检测方法
杨锶齐
易尧华
汤梓伟
王新宇
《计算机工程与应用》
CSCD
北大核心
2021
8
在线阅读
下载PDF
职称材料
7
多方向自然场景文本检测
何思楠
郭永金
张利
《计算机应用研究》
CSCD
北大核心
2018
6
在线阅读
下载PDF
职称材料
8
基于注意力机制与深度多尺度特征融合的自然场景文本检测
李雨
闫甜甜
周东生
魏小鹏
《图学学报》
CSCD
北大核心
2023
3
在线阅读
下载PDF
职称材料
9
自然场景文本快速检测识别方法
燕天
《探测与控制学报》
CSCD
北大核心
2023
0
在线阅读
下载PDF
职称材料
10
基于随机区域扩张算法的多方向文本检测
哈恩楠
吉立新
高超
《计算机工程与设计》
北大核心
2018
0
在线阅读
下载PDF
职称材料
11
一种车辆识别代号检测和识别的弱监督学习方法
曹志
尚丽丹
尹东
《光电工程》
CAS
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部