期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
深度学习的自然场景文本识别方法综述 被引量:4
1
作者 曾凡智 冯文婕 周燕 《计算机科学与探索》 CSCD 北大核心 2024年第5期1160-1181,共22页
自然场景文本识别在学术研究和实际应用中具有重要价值,已经成为计算机视觉领域的研究热点之一。然而,识别过程存在文本风格多样、背景环境复杂等挑战,导致识别效率和准确率不佳。传统的基于手工设计特征文本识别方法由于其有限的表示能... 自然场景文本识别在学术研究和实际应用中具有重要价值,已经成为计算机视觉领域的研究热点之一。然而,识别过程存在文本风格多样、背景环境复杂等挑战,导致识别效率和准确率不佳。传统的基于手工设计特征文本识别方法由于其有限的表示能力,不足以有效地应对复杂的自然场景文本识别任务。近年来,采用深度学习方法在自然场景文本识别中取得了重大进展,系统地梳理了近年来相关研究工作。首先,根据是否需要对单字符进行分割,将自然场景文本识别方法分为基于分割与无需分割的方法,再根据其技术实现特点将无需分割的方法进行细分,并对各类最具有代表性的方法工作原理进行了阐述。然后,介绍了当前常用数据集以及评价指标,并在数据集上对各类方法进行了性能对比,从多个方面讨论了各类方法的优势与局限性。最后,指出基于深度学习的自然场景文本识别研究存在的不足和难点,对其未来的发展趋势进行了展望。 展开更多
关键词 文本识别 深度学习 自然场景
在线阅读 下载PDF
基于多头注意力机制与长短期记忆网络的自然场景文本识别 被引量:2
2
作者 姚炜 冯宪伟 《传感技术学报》 CSCD 北大核心 2024年第12期2107-2112,共6页
随着计算机视觉和自然语言处理技术的不断发展,自然场景文本检测与识别技术已成为计算机视觉领域的研究热点之一。提出了一种基于多头注意力机制与长短期记忆网络(LSTM)的自然场景文本检测与识别方法。该方法通过结合目标检测算法和序... 随着计算机视觉和自然语言处理技术的不断发展,自然场景文本检测与识别技术已成为计算机视觉领域的研究热点之一。提出了一种基于多头注意力机制与长短期记忆网络(LSTM)的自然场景文本检测与识别方法。该方法通过结合目标检测算法和序列识别算法,利用多头注意力机制对图像中的文本区域进行精确的定位和特征提取,进而通过LSTM网络对提取的特征进行编码和解码,实现对自然场景中文本的准确识别。在文本检测阶段,采用基于深度学习的目标检测算法,结合多头注意力机制,通过并行计算多个独立的注意力头来捕获图像中不同尺度和方向上的文本信息,提高文本检测的准确性和鲁棒性。在文本识别阶段,利用LSTM网络对检测到的文本区域进行序列建模,通过编码和解码过程将图像中的文本信息转化为可读的字符序列。实验结果表明,所提出的方法在自然场景文本检测与识别任务上取得了优异的性能。与现有的方法相比,所提出的方法在准确性和鲁棒性方面均有所提升,尤其是在处理复杂背景和多样化文本时表现出更好的适应性。 展开更多
关键词 文本检测与识别 多头注意力机制 自然场景文本 长短期记忆网络
在线阅读 下载PDF
一种基于信息熵迁移的文本检测模型自蒸馏方法 被引量:1
3
作者 陈建炜 杨帆 赖永炫 《自动化学报》 EI CAS CSCD 北大核心 2024年第11期2128-2139,共12页
前沿的自然场景文本检测方法大多基于全卷积语义分割网络,利用像素级分类结果有效检测任意形状的文本,其主要缺点是模型大、推理时间长、内存占用高,这在实际应用中限制了其部署.提出一种基于信息熵迁移的自蒸馏训练方法(Self-distillat... 前沿的自然场景文本检测方法大多基于全卷积语义分割网络,利用像素级分类结果有效检测任意形状的文本,其主要缺点是模型大、推理时间长、内存占用高,这在实际应用中限制了其部署.提出一种基于信息熵迁移的自蒸馏训练方法(Self-distillation via entropy transfer,SDET),利用文本检测网络深层网络输出的分割图(Segmentation map,SM)信息熵作为待迁移知识,通过辅助网络将信息熵反馈给浅层网络.与依赖教师网络的知识蒸馏(Knowledge distillation,KD)不同,SDET仅在训练阶段增加一个辅助网络,以微小的额外训练代价实现无需教师网络的自蒸馏(Self-distillation,SD).在多个自然场景文本检测的标准数据集上的实验结果表明,SDET在基线文本检测网络的召回率和F1得分上,能显著优于其他蒸馏方法. 展开更多
关键词 自然场景 文本检测 知识蒸馏 自蒸馏 信息熵
在线阅读 下载PDF
基于深度学习的自然场景文本检测综述 被引量:7
4
作者 连哲 殷雁君 +1 位作者 云飞 智敏 《计算机工程》 CAS CSCD 北大核心 2024年第3期16-27,共12页
基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和... 基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。 展开更多
关键词 深度学习 计算机视觉 自然场景文本 文本检测 多方向文本检测 多尺度文本检测
在线阅读 下载PDF
基于深度学习的场景文字识别技术研究
5
作者 陈志宇 司占军 朱新雨 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第3期237-243,291,共8页
基于深度学习的场景文字识别技术(Scene Text Recognition,STR)应用广泛但性能尚需提升。针对现有的STR技术对小目标文字识别不准确和中文、中英文混合准确率低的问题,通过改进模型增加104×104的特征尺度,用Focal Loss和GIOU Loss... 基于深度学习的场景文字识别技术(Scene Text Recognition,STR)应用广泛但性能尚需提升。针对现有的STR技术对小目标文字识别不准确和中文、中英文混合准确率低的问题,通过改进模型增加104×104的特征尺度,用Focal Loss和GIOU Loss作为损失函数来优化目标检测框,将卷积块注意力模块(Convolutional Block Attention Module,CBAM)嵌入到卷积层中,使网络在特定位置和通道上更加关注目标,抑制其余复杂背景信息以此来提高模型的文字检测能力;分析中文的文字特征,对CRNN的特征提取网络改进优化,提高了原有模型对中文、中英文混合识别的准确性。实验结果表明,通过对文字检测与识别模型和算法的改进优化,大大提高了场景文字识别技术的准确性和鲁棒性。 展开更多
关键词 深度学习 场景文字识别技术 图像处理 目标检测 文字识别
在线阅读 下载PDF
基于深度学习的自然场景文本检测与识别综述 被引量:45
6
作者 王建新 王子亚 田萱 《软件学报》 EI CSCD 北大核心 2020年第5期1465-1496,共32页
自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别... 自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势. 展开更多
关键词 深度学习 自然场景 文本检测 文本识别 端到端
在线阅读 下载PDF
面向自然场景图像的三阶段文字识别框架 被引量:7
7
作者 邹北骥 杨文君 +1 位作者 刘姝 姜灵子 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2021年第1期1-8,共8页
文字识别技术在文档管理、图像理解、视觉导航等中具有重要应用。然而,自然场景中的文字通常排列任意、形状不一、字体多样,难以被检测和识别。提出了面向自然场景图像的三阶段文字识别框架,该框架包括文字检测、文字矫正和文字识别。首... 文字识别技术在文档管理、图像理解、视觉导航等中具有重要应用。然而,自然场景中的文字通常排列任意、形状不一、字体多样,难以被检测和识别。提出了面向自然场景图像的三阶段文字识别框架,该框架包括文字检测、文字矫正和文字识别。首先,利用特征金字塔网络分割图像中的字符,基于双向长短期记忆网络获取字符间的亲和度,连接孤立字符构建单词行,文字检测率(F分数)高达91.97%。然后,通过多目标矫正网络矫正被检测文字,以应对场景图像文字的复杂形变,增强阅读性。最后,通过注意力序列识别网络按序输出预测结果,实现单词级识别,文字识别正确率达84.98%。 展开更多
关键词 文字识别 自然场景 文字检测 文字矫正
在线阅读 下载PDF
自然场景文本检测与端到端识别:深度学习方法 被引量:9
8
作者 周燕 韦勤彬 +4 位作者 廖俊玮 曾凡智 冯文婕 刘翔宇 周月霞 《计算机科学与探索》 CSCD 北大核心 2023年第3期577-594,共18页
自然场景图像中丰富的文本内容对场景理解有着重要意义,但自然场景文本往往具有极端横纵比、字体风格多变、背景及形状复杂等特点,而传统的文本检测与端到端识别方法存在着模型设计复杂、效率低、适用性不强且耗费成本高等缺点。随着深... 自然场景图像中丰富的文本内容对场景理解有着重要意义,但自然场景文本往往具有极端横纵比、字体风格多变、背景及形状复杂等特点,而传统的文本检测与端到端识别方法存在着模型设计复杂、效率低、适用性不强且耗费成本高等缺点。随着深度学习技术在图像领域的迅速发展,自然场景文本检测与端到端识别方法取得了突破性的进展,其性能和效率得到了显著提高。针对自然场景文本检测与端到端识别方法,梳理了近年来相关的研究工作。首先,根据文本框生成方式的不同,主要从回归候选框和像素分割两个角度来划分自然场景文本检测方法的基本思想,并对各类代表性的方法进行了详细叙述;其次,从端到端识别速度与解耦检测和识别任务的角度对端到端识别方法的技术发展路线进行了归纳总结;然后,介绍了常用的公开文本数据集,并在公开的文本数据集上对各类方法进行了性能对比;最后,对自然场景文本检测与端到端识别的主流研究方向进行了讨论,并阐述了其面临的挑战和未来的发展趋势。 展开更多
关键词 深度学习 自然场景 文本检测 端到端识别
在线阅读 下载PDF
基于自适应色彩聚类和上下文信息的自然场景文本检测 被引量:3
9
作者 邹北骥 郭建京 +2 位作者 朱承璋 杨文君 徐子雯 《电子学报》 EI CAS CSCD 北大核心 2018年第6期1436-1444,共9页
自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适... 自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率.然后,利用文本中字符成行出现的性质,设计一种基于上下文信息的字符验证策略,既能保证较高字符召回率,也能有效移除非文本字符.最后,合并字符构建文本行,并通过后处理得到文本检测结果.在ICDAR2013公共数据集上的实验结果表明:本文分别获得74.17%的召回率,83.40%的准确率和78.52%的F得分.与其他文本检测方法相比,本文获得了较好的文本检测性能,说明本文方法的优越性. 展开更多
关键词 自然场景文本检测 自适应色彩聚类 上下文信息 自学习策略
在线阅读 下载PDF
深度卷积网络的自然场景文本检测研究综述 被引量:2
10
作者 宋传鸣 王一琦 +3 位作者 武惠娟 何熠辉 洪飏 王相海 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1996-2008,共13页
自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战.研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点... 自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战.研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点问题之一.并且,基于深度卷积网络的自然场景文本检测方法逐渐成为主流.因此,从自然场景文本检测技术的研究背景及主要挑战切入,根据骨干网络的不同将现有方法划分为基于VGG网络的文本检测方法、基于残差网络的文本检测方法和基于特征金字塔网络的文本检测方法,重点阐述各类方法的核心思想、技术优势及其不足;然后,总结自然场景文本检测的公共数据集,对代表性方法的检测性能进行客观比较;最后,梳理和总结自然场景文本检测技术的难点并展望其未来发展趋势. 展开更多
关键词 文本检测 自然场景文本 综述 深度学习 深度卷积网络
在线阅读 下载PDF
基于笔画宽度变换的自然场景文本检测方法 被引量:6
11
作者 宋文 肖建于 《计算机工程与应用》 CSCD 2013年第9期190-192,共3页
根据自然场景中文字笔画倾向于固定宽度的特点,提出一种基于像素笔画宽度变换的自然场景文本检测方法。该方法利用笔画宽度变换方法计算图像中每一个像素的笔画宽度,将笔画宽度大致相等的相邻像素合并形成文本候选区域,按照规则滤除一... 根据自然场景中文字笔画倾向于固定宽度的特点,提出一种基于像素笔画宽度变换的自然场景文本检测方法。该方法利用笔画宽度变换方法计算图像中每一个像素的笔画宽度,将笔画宽度大致相等的相邻像素合并形成文本候选区域,按照规则滤除一部分非文本区域从而实现文本的检测。实验结果表明,所提出的基于笔画宽度变换的文本检测方法避开了文本特征分类问题,能够提高文本检测的准确率和召回率,同时缩短文本检测的时间。 展开更多
关键词 笔画宽度 笔画宽度变换 自然场景 文本检测
在线阅读 下载PDF
自然场景车标数据集的构建及其应用 被引量:2
12
作者 邹北骥 雷太航 +2 位作者 刘姝 廖望旻 姜灵子 《国防科技大学学报》 EI CAS CSCD 北大核心 2021年第1期95-102,共8页
车标作为车辆身份的关键特征之一,在车辆的监控与辨识中发挥着重要作用。由于自然场景复杂多变,对其中的车标进行准确识别仍具有很大的挑战性。目前公开数据库很少且存在诸多局限,导致研究缺乏可信度和实用性。本文建立了一个面向自然... 车标作为车辆身份的关键特征之一,在车辆的监控与辨识中发挥着重要作用。由于自然场景复杂多变,对其中的车标进行准确识别仍具有很大的挑战性。目前公开数据库很少且存在诸多局限,导致研究缺乏可信度和实用性。本文建立了一个面向自然场景的全新数据集,包含多种采集环境下的10324幅、67类车辆图像。基于此数据集开展应用研究,提出一个目标检测与深度学习相结合的车标识别方法,包括车标区域定位和车标种类预测两大步骤。实验表明,该方法对复杂背景有较强的适应性,在涉及30种车标的分类任务中达到89.0%的总体识别率。 展开更多
关键词 车标识别 自然场景 目标检测 深度学习
在线阅读 下载PDF
聚焦难样本的区分尺度的文字检测方法 被引量:4
13
作者 林泓 卢瑶瑶 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第8期1506-1516,共11页
针对卷积神经网络中间特征层信息利用不充分,以及不区分尺度和难易样本的学习所导致的文字检测精度难以提高的问题,提出基于多路精细化特征融合的聚焦难样本的区分尺度的自然场景文字检测方法.构建多路精细化的卷积神经网络融合层提取... 针对卷积神经网络中间特征层信息利用不充分,以及不区分尺度和难易样本的学习所导致的文字检测精度难以提高的问题,提出基于多路精细化特征融合的聚焦难样本的区分尺度的自然场景文字检测方法.构建多路精细化的卷积神经网络融合层提取高分辨率特征图;按照文字标注矩形框的较长边的尺寸,将文字实例划分为3种尺度范围,并分布到不同的候选框提取网络中提取相应的候选框;设计聚焦损失函数对难样本进行重点学习以提高模型的表达能力并得到目标文字框.实验表明,所提出的多路精细化特征提取方法在COCO-Text数据集上的文字召回率较高,聚焦难样本的区分尺度的文字检测方法在ICDAR2013、ICDAR2015标准数据集上的检测精度分别为0.89、0.83,与CTPN、RRPN等方法相比,在多尺度多方向的自然场景图像中具有更强的鲁棒性. 展开更多
关键词 深度学习 自然场景 文字检测 特征融合 难样本 聚焦损失
在线阅读 下载PDF
自然场景文本检测关键技术及应用 被引量:4
14
作者 易尧华 杨锶齐 +1 位作者 王新宇 汤梓伟 《数字印刷》 北大核心 2020年第4期1-11,22,共12页
场景文本信息理解是计算机视觉任务(诸如智能导航等)的基础,基于卷积神经网络的自然场景图像文本检测是计算机视觉领域的研究热点。本文梳理自然场景文本检测方法体系,归纳总结场景文本检测方法、评价协议及测试数据集;阐述分析自然场... 场景文本信息理解是计算机视觉任务(诸如智能导航等)的基础,基于卷积神经网络的自然场景图像文本检测是计算机视觉领域的研究热点。本文梳理自然场景文本检测方法体系,归纳总结场景文本检测方法、评价协议及测试数据集;阐述分析自然场景文本检测的关键技术及应用领域;展望自然场景文本检测的发展趋势。 展开更多
关键词 自然场景 卷积神经网络 文本检测 关键技术
在线阅读 下载PDF
联合边界框校准的自然场景文本检测 被引量:1
15
作者 方承志 火兴龙 程宥铖 《计算机工程与应用》 CSCD 北大核心 2021年第1期161-167,共7页
针对自然场景下多方向文本对象,提出一种基于深度学习的文本检测方法。该方法在设计锚框时剥离锚框的方向特征但保留其长宽比特征,在覆盖相同长宽比范围时,锚框设计数量减少,从而缓解采样密集时正负样本类别失衡的影响。在方法的后处理... 针对自然场景下多方向文本对象,提出一种基于深度学习的文本检测方法。该方法在设计锚框时剥离锚框的方向特征但保留其长宽比特征,在覆盖相同长宽比范围时,锚框设计数量减少,从而缓解采样密集时正负样本类别失衡的影响。在方法的后处理阶段,提出一种边界框校准算法,该算法利用最大稳定极值区域(MSER)获取字符边缘信息,通过基于规则的逻辑判断,对边界框进行收缩或膨胀操作,从而达到边界框校准目的。通过在公开数据集ICDAR2015上的测试与比较,验证了所提边界框校准算法的有效性。 展开更多
关键词 文本检测 自然场景 类别失衡 边界框校准
在线阅读 下载PDF
深度学习在场景文字识别技术中的应用综述 被引量:24
16
作者 刘艳菊 伊鑫海 +2 位作者 李炎阁 张惠玉 刘彦忠 《计算机工程与应用》 CSCD 北大核心 2022年第4期52-63,共12页
随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展。受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战。从深度学习的角度对场景... 随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展。受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战。从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以解决小文本区域的召回率较低的问题,同时适应多尺度文本;在文本识别方法中将CTC机制与Attention机制相结合,可以相互监督以提升识别性能,降低长文本识别的出错率。 展开更多
关键词 深度学习 计算机视觉 自然场景 文本检测 文字识别
在线阅读 下载PDF
基于笔画角度变换和宽度特征的自然场景文本检测 被引量:4
17
作者 陈硕 郑建彬 +1 位作者 詹恩奇 汪阳 《计算机应用研究》 CSCD 北大核心 2019年第4期1270-1274,共5页
针对光照不均和背景复杂度所导致的自然场景文本检测中文本的漏检和错检现象,提出一种基于笔画角度变换和宽度特征的自然场景文本检测方法。分析发现与非文本相比,文本具有较稳定的笔画角度变换次数和笔画宽度,针对这两个特性提出笔画... 针对光照不均和背景复杂度所导致的自然场景文本检测中文本的漏检和错检现象,提出一种基于笔画角度变换和宽度特征的自然场景文本检测方法。分析发现与非文本相比,文本具有较稳定的笔画角度变换次数和笔画宽度,针对这两个特性提出笔画外边界优劣角变换次数和增强笔画支持像素面积比两种特征。前者分段统计笔画外轮廓角度变换次数;后者计算笔画宽度稳定区域在笔画总面积的占比,用来分别反映笔画角度和宽度变化稳定特性。为降低文本漏检率,采用多通道最大稳定极值区域(maximally stable extremal regions,MSER)检测,合并所有候选区域,提取候选区域的笔画特征和纹理特征,利用支持向量机完成文本和非文本区域分类。在ICDAR2015数据库上,算法的精确率和召回率分别达到79. 3%和72. 8%,并在一定程度上解决了光照不均和复杂背景的问题。 展开更多
关键词 自然场景 文本检测 笔画特征
在线阅读 下载PDF
基于边缘检测和特征融合的自然场景文本定位 被引量:5
18
作者 王梦迪 张友梅 常发亮 《计算机科学》 CSCD 北大核心 2017年第9期300-303,314,共5页
文本定位作为文本识别的基础和前提,对图像深层信息的理解至关重要。针对自然场景下的文本定位受光照、复杂背景等因素影响较大的问题,提出了一种基于多方向边缘检测和自适应特征融合的自然场景文本定位方法。该方法首先将自然场景图像... 文本定位作为文本识别的基础和前提,对图像深层信息的理解至关重要。针对自然场景下的文本定位受光照、复杂背景等因素影响较大的问题,提出了一种基于多方向边缘检测和自适应特征融合的自然场景文本定位方法。该方法首先将自然场景图像进行三通道八方向的边缘检测;然后通过启发式规则对得到的边缘图像进行过滤从而提取出备选文本域,进而对备选文本域进行自适应权值的HOG-LBP特征提取与融合;最后采用支持向量机进行特征分类学习,实现文本定位。实验结果表明,该方法能准确定位自然场景图片的文本区域,对光照和复杂背景具有较强的鲁棒性。 展开更多
关键词 自然场景 文本定位 边缘检测 特征融合
在线阅读 下载PDF
基于聚类与边缘检测的自然场景文本提取方法 被引量:4
19
作者 常莹 何东健 李宗儒 《计算机工程与设计》 CSCD 北大核心 2010年第18期4040-4043,共4页
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法。该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分... 为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法。该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取。实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域。 展开更多
关键词 自然场景 文本提取 聚类 连通区域标记与分析 边缘检测
在线阅读 下载PDF
基于对象建议算法的自然场景文本检测 被引量:6
20
作者 哈恩楠 吉立新 高超 《计算机应用研究》 CSCD 北大核心 2018年第2期624-627,636,共5页
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征... 对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征和边缘梯度特征,并将文本和非文本区域的区分问题转换成一个二值标记问题,通过最小化能量函数寻找最佳标记;最后,通过均值漂移聚类寻找文本区域的中心生成文本行。经实验证明,本算法在常用的自然场景文本检测数据集上速度得到了提高,并且一定程度上解决了传统最稳定极值区域算法对光照敏感的问题,获得了较高的查全率。 展开更多
关键词 对象建议算法 最稳定极值区域 贝叶斯分类器 自然场景文本检测
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部