期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
改进FCENet的自然场景文本检测算法
1
作者 周燕 廖俊玮 +2 位作者 刘翔宇 周月霞 曾凡智 《计算机工程与应用》 CSCD 北大核心 2024年第3期228-236,共9页
针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模... 针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模块。多尺度残差特征增强模块作为骨干网络顶层的残差分支,增强了特征金字塔结构自上而下的高层语义信息流动,提高了文本像素分类能力,有效减少误检现象。多尺度注意力特征融合模块使不同语义和尺度的特征能够更好地融合,结合自底向上的特征融合网络,有效避免文本过度分割并提高了弯曲文本的检测能力。实验结果表明,该方法在弯曲文本数据集CTW1500和Total-Text上的综合指标F值分别达到了86.2%和86.5%,相比原算法FCENet分别提升了1.1和0.7个百分点。 展开更多
关键词 自然场景文本检测 特征融合 特征增强 注意力机制 FCENet
在线阅读 下载PDF
多层次MSER自然场景文本检测 被引量:11
2
作者 唐有宝 卜巍 邬向前 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第6期1134-1140,共7页
提出一种新的基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,其由候选区域的提取和文本检测组成.在候选区域提取过程中,采用多层次MSER区域提取方法:通过对原始图像进行多个颜色空间变换和多尺度放缩得到多个变换后的图像,... 提出一种新的基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,其由候选区域的提取和文本检测组成.在候选区域提取过程中,采用多层次MSER区域提取方法:通过对原始图像进行多个颜色空间变换和多尺度放缩得到多个变换后的图像,采用多个阈值对其进行MSER区域检测,并将检测到的区域作为候选区域用于文本检测.检测过程中,对候选区域提取手工设计的底层特征和基于卷积神经网络(CNN)的深层特征,训练一个随机森林回归器对特征进行分类得到字符区域,再将其合并成单词区域,并进行相似的特征提取和分类,从而得到最终的文本检测结果.使用2个标准的数据库(ICDAR2011和ICDAR2013)对提出的方法进行性能评价,F指标在ICDAR2011和ICDAR2013上均为0.79,表明了所提出的自然场景文本检测方法的有效性. 展开更多
关键词 自然场景文本检测 多层次最大稳定极值区域(MSER) 卷积神经网络(CNN) 随机森林回归器
在线阅读 下载PDF
基于自适应色彩聚类和上下文信息的自然场景文本检测 被引量:3
3
作者 邹北骥 郭建京 +2 位作者 朱承璋 杨文君 徐子雯 《电子学报》 EI CAS CSCD 北大核心 2018年第6期1436-1444,共9页
自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适... 自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率.然后,利用文本中字符成行出现的性质,设计一种基于上下文信息的字符验证策略,既能保证较高字符召回率,也能有效移除非文本字符.最后,合并字符构建文本行,并通过后处理得到文本检测结果.在ICDAR2013公共数据集上的实验结果表明:本文分别获得74.17%的召回率,83.40%的准确率和78.52%的F得分.与其他文本检测方法相比,本文获得了较好的文本检测性能,说明本文方法的优越性. 展开更多
关键词 自然场景文本检测 自适应色彩聚类 上下文信息 自学习策略
在线阅读 下载PDF
基于对象建议算法的自然场景文本检测 被引量:6
4
作者 哈恩楠 吉立新 高超 《计算机应用研究》 CSCD 北大核心 2018年第2期624-627,636,共5页
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征... 对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征和边缘梯度特征,并将文本和非文本区域的区分问题转换成一个二值标记问题,通过最小化能量函数寻找最佳标记;最后,通过均值漂移聚类寻找文本区域的中心生成文本行。经实验证明,本算法在常用的自然场景文本检测数据集上速度得到了提高,并且一定程度上解决了传统最稳定极值区域算法对光照敏感的问题,获得了较高的查全率。 展开更多
关键词 对象建议算法 最稳定极值区域 贝叶斯分类器 自然场景文本检测
在线阅读 下载PDF
面向自然场景文本检测的改进NMS算法 被引量:9
5
作者 杨有为 周刚 《计算机工程与应用》 CSCD 北大核心 2022年第1期204-208,共5页
近些年来,卷积神经网络算法在自然场景文本检测效果上较传统算法已经有了很大提升,但如何有效处理神经网络输出层候选框仍然值得研究。非极大值抑制算法(non-maximum suppression,NMS)通过选择最高置信度候选框作为检测结果,往往容易对... 近些年来,卷积神经网络算法在自然场景文本检测效果上较传统算法已经有了很大提升,但如何有效处理神经网络输出层候选框仍然值得研究。非极大值抑制算法(non-maximum suppression,NMS)通过选择最高置信度候选框作为检测结果,往往容易对较长文本以及混叠文本区域检测失效。考虑到该问题,可以将候选框集合进行排序滤波与融合计算,得到更准确的候选框,有效减少上述检测失效的情况。这种方法,可以直接嵌入原有方法中,而不需要改变网络结构或者增加任何训练量。通过在公开数据集上进行实验,对比其他方法,该方法有较大优势。 展开更多
关键词 自然场景文本检测 卷积神经网络 非极大值抑制 排序滤波 融合计算
在线阅读 下载PDF
嵌入注意力机制的自然场景文本检测方法 被引量:8
6
作者 杨锶齐 易尧华 +1 位作者 汤梓伟 王新宇 《计算机工程与应用》 CSCD 北大核心 2021年第24期185-191,共7页
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法。利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改... 针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法。利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围。实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中。 展开更多
关键词 自然场景文本检测 特征金字塔网络 区域建议网络 注意力机制
在线阅读 下载PDF
多方向自然场景文本检测 被引量:6
7
作者 何思楠 郭永金 张利 《计算机应用研究》 CSCD 北大核心 2018年第7期2193-2196,共4页
针对自然场景图像背景复杂和文本方向不确定的问题,提出一种多方向自然场景文本检测的方法。该方法利用颜色增强的最大稳定极值区域(C-MSER)方法对图像中的字符候选区域进行提取,并利用启发式规则和LIBSVM分类器对非字符区域进行消除;... 针对自然场景图像背景复杂和文本方向不确定的问题,提出一种多方向自然场景文本检测的方法。该方法利用颜色增强的最大稳定极值区域(C-MSER)方法对图像中的字符候选区域进行提取,并利用启发式规则和LIBSVM分类器对非字符区域进行消除;然后设计位置颜色模型将被误滤除的字符找回,并利用字符区域中心进行拟合估计文本行倾斜角度;最后通过一个CNN分类器得到精确的结果。该算法在两个标准数据集上(ICDAR2011和ICDAR2013)测试,得到F-score分别为0.81和0.82,证明了该方法的有效性。 展开更多
关键词 自然场景文本检测 颜色增强的最大稳定极值区域 特征提取 多方向估计 分类器
在线阅读 下载PDF
基于注意力机制与深度多尺度特征融合的自然场景文本检测 被引量:3
8
作者 李雨 闫甜甜 +1 位作者 周东生 魏小鹏 《图学学报》 CSCD 北大核心 2023年第3期473-481,共9页
针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更... 针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更具判别力的特征表示;然后设计深度多尺度特征融合模块,将不同尺度的特征信息进行交互,自适应地学习不同尺度特征图对应的权重矩阵,用于融合文本实例在不同尺度特征图上具有判别力的特征信息,从而获得更具鲁棒性的多尺度融合特征图;最后利用自适应的二值化后处理模块生成更加精确的文本区域边界框。为评估其有效性,大量实验在ICDAR2015,ICDAR2013和CTW1500数据集上进行验证,结果表明该方法相较于其他先进的检测方法取得了有竞争力的检测结果,展现出良好的鲁棒性和泛化能力。 展开更多
关键词 自然场景文本检测 注意力机制 多尺度特征融合 二值化 自适应
在线阅读 下载PDF
自然场景文本快速检测识别方法
9
作者 燕天 《探测与控制学报》 CSCD 北大核心 2023年第3期126-133,共8页
针对基于卷积循环神经网络或实例分割的自然场景文本图像检测识别方法结构复杂、实时性差、鲁棒性低的问题,提出基于改进Faster RCNN和高斯混合模型(GMM)的文本图像快速检测识别方法。该方法首先使用改进的Faster RCNN模型进行单字符检... 针对基于卷积循环神经网络或实例分割的自然场景文本图像检测识别方法结构复杂、实时性差、鲁棒性低的问题,提出基于改进Faster RCNN和高斯混合模型(GMM)的文本图像快速检测识别方法。该方法首先使用改进的Faster RCNN模型进行单字符检测识别并求出图中文本区域的数量,然后使用高斯混合模型进行单字符聚类并构造出候选的多边形文本框,最后使用重定义的置信度公式筛选出适当的文本区域边框,并输出边框内的字符标签序列。公共数据集的测试结果表明,该方法具有良好的鲁棒性和实时性。 展开更多
关键词 自然场景文本检测识别 改进的Faster RCNN 高斯混合模型 鲁棒性 实时性
在线阅读 下载PDF
基于随机区域扩张算法的多方向文本检测
10
作者 哈恩楠 吉立新 高超 《计算机工程与设计》 北大核心 2018年第4期1095-1099,共5页
针对传统文本检测方法只能定位水平文本或近水平文本的问题,提出随机区域扩张算法,定位任意方向文本。使用最稳定极值区域算法对输入图片预处理,得到文本备选区域;设计3个尺度不变、方向鲁棒的特征,通过贝叶斯算法融合多特征生成概率映... 针对传统文本检测方法只能定位水平文本或近水平文本的问题,提出随机区域扩张算法,定位任意方向文本。使用最稳定极值区域算法对输入图片预处理,得到文本备选区域;设计3个尺度不变、方向鲁棒的特征,通过贝叶斯算法融合多特征生成概率映射,使用条件随机场模型标记文本和非文本区域;提出随机区域扩张算法,将属于相同文本行的字符连接在一起,寻找包围文本行的最小区域,定位多方向文本。实验结果表明,该算法在自然场景文本经典数据集上取得了较好的效果,能够较好定位任意方向的文本。 展开更多
关键词 最稳定极值区域 贝叶斯算法 随机区域扩张算法 自然场景文本检测 多方向文本定位
在线阅读 下载PDF
一种车辆识别代号检测和识别的弱监督学习方法 被引量:2
11
作者 曹志 尚丽丹 尹东 《光电工程》 CAS CSCD 北大核心 2021年第2期78-90,共13页
车辆识别代号对于车辆年检具有重要的意义。由于缺乏字符级标注,无法对车辆识别代号进行单字符风格校验。针对该问题,设计了一种单字符检测和识别框架,并对此框架提出了一种无须字符级标注的弱监督学习方法。首先,对VGG16-BN各个层次的... 车辆识别代号对于车辆年检具有重要的意义。由于缺乏字符级标注,无法对车辆识别代号进行单字符风格校验。针对该问题,设计了一种单字符检测和识别框架,并对此框架提出了一种无须字符级标注的弱监督学习方法。首先,对VGG16-BN各个层次的特征信息进行融合,获得具有单字符位置信息与语义信息的融合特征图;其次,设计了一个字符检测分支和字符识别分支的网络结构,用于提取融合特征图中的单字符位置和语义信息;最后,利用文本长度和单字符类别信息,对所提框架在无字符级标注的车辆识别代号数据集上进行弱监督训练。实验结果表明,本文方法在车辆识别代号测试集上得到的检测Hmean数值达到0.964,单字符检测和识别准确率达到95.7%,具有很强的实用性。 展开更多
关键词 卷积神经网络 弱监督学习 自然场景文本检测 自然场景文本识别 车辆识别代号
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部