检索结果-维普期刊中文期刊服务平台

注意力机制在自然场景文字检测中的应用被引量：14: 1; 作者王延昭顾晓东《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第12期1908-1915,共8页; 针对目前主流的基于分割的文字检测方法中由于需要复杂的后处理过程保证检测精度,通常难以实现高检测速度的问题,提出一种应用位置注意力模块和金字塔注意力网络2种注意力机制的方法.首先用金字塔注意力网络对图像进行特征提取及语义分... 展开更多; 关键词自然场景文字检测神经网络金字塔注意力网络位置注意力机制; 在线阅读下载PDF 职称材料

基于RetinaNet的场景文字检测算法被引量：3: 2; 作者金灵张轶《计算机应用与软件》北大核心 2022年第2期201-207,共7页; 针对场景文字区域尺度变化较大,具有较大的长宽比,且具有任意方向性等问题,提出一种基于神经网络的场景文字检测模型。基于直接回归方法设计,无需预先设置锚框,在多次层次构建特征,且在多个分支之间共享卷积核。实验阶段在多个数据集上... 展开更多; 关键词深度学习计算机视觉场景文字检测; 在线阅读下载PDF 职称材料

基于FCN的多方向自然场景文字检测方法被引量：13: 3; 作者杨剑锋王润民 +2 位作者何璇李秀梅钱盛友《计算机工程与应用》 CSCD 北大核心 2020年第2期164-170,共7页; 传统的自然场景文字检测方法所采用的手工设计特征在应对复杂自然场景时缺乏鲁棒性。针对复杂自然场景中的多方向文字检测问题,提出了一种新的基于深度学习文字检测方法,采用全卷积网络(Fully Convolutional Networks,FCN)并融合多尺度... 展开更多; 关键词自然场景文字检测深度学习全卷积网络语义分割; 在线阅读下载PDF 职称材料

基于改进Mask R-CNN的越南场景文字检测: 4; 作者俸亚特文益民《计算机应用》 CSCD 北大核心 2021年第12期3551-3557,共7页; 针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络MaskR-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并... 展开更多; 关键词 MaskR-CNN 越南场景文字检测声调符号模型联合训练分割模型重复检测; 在线阅读下载PDF 职称材料

场景文字识别技术研究综述被引量：20: 5; 作者王德青吾守尔·斯拉木许苗苗《计算机工程与应用》 CSCD 北大核心 2020年第18期1-15,共15页; 对文字检测和识别技术进行了全面的介绍。介绍了自然场景文字识别技术的研究背景、应用领域、技术难点等;介绍了场景文字识别的预处理技术及流程,介绍了近年来出现的基于深度学习的通用检测网络、维吾尔文和中英文的深度学习文字检测网... 展开更多; 关键词场景文字检测文本识别深度学习端到端检测识别; 在线阅读下载PDF 职称材料

面向混叠文字检测的单向投影Transformer方法被引量：2: 6; 作者冯智达陈黎《计算机应用》 CSCD 北大核心 2022年第12期3686-3691,共6页; 针对基于分割的文字检测方法在混叠文字场景下性能下降的问题,提出了单向投影Transformer(SDPT)用于混叠文本检测。首先,使用深度残差网络(ResNet)和特征金字塔网络(FPN)提取并融合多尺度特征;然后,利用水平投影将特征图投影成向量序列... 展开更多; 关键词计算机视觉深度学习场景文字检测混叠文字投影 Transformer算法; 在线阅读下载PDF 职称材料

适用于文字检测的候选框提取算法被引量：2: 7; 作者朱盈盈张拯 +3 位作者章成全张兆翔白翔刘文予《数据采集与处理》 CSCD 北大核心 2017年第6期1097-1106,共10页; 在文字检测的相关研究中,针对文字的候选框提取方法并未得到广泛关注与深入挖掘。一方面由于文字本身结构和一般物体具有较强的差异性,另一方面由于文字对检测的精度要求高。本文提出了一种针对文字的候选框提取算法,该算法首先利用全... 展开更多; 关键词物体候选框自然场景文字检测全卷积网络 EdgeBox; 在线阅读下载PDF 职称材料

题名注意力机制在自然场景文字检测中的应用被引量：14: 1; 作者王延昭顾晓东; 机构复旦大学信息科学与工程学院电子工程系; 出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第12期1908-1915,共8页; 基金国家自然科学基金面上项目(61771145).; 文摘针对目前主流的基于分割的文字检测方法中由于需要复杂的后处理过程保证检测精度,通常难以实现高检测速度的问题,提出一种应用位置注意力模块和金字塔注意力网络2种注意力机制的方法.首先用金字塔注意力网络对图像进行特征提取及语义分割;同时将位置注意力模块应用于高层特征,通过加强图像中相似物体的权重加强对文字的检测效果;最后进行简单有效的后处理,在实现较高检测准确度的前提下提高检测速度.实验结果表明,在Total-text数据集中,采用更轻量化的骨干网络时,所提方法在检测速度上优势明显;采用更深层的骨干网络时,所提方法的检测准确度领先2.0%.; 关键词自然场景文字检测神经网络金字塔注意力网络位置注意力机制; Keywords scene text detection neural network pyramid attention network position attention module; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于RetinaNet的场景文字检测算法被引量：3: 2; 作者金灵张轶; 机构四川大学计算机学院; 出处《计算机应用与软件》北大核心 2022年第2期201-207,共7页; 文摘针对场景文字区域尺度变化较大,具有较大的长宽比,且具有任意方向性等问题,提出一种基于神经网络的场景文字检测模型。基于直接回归方法设计,无需预先设置锚框,在多次层次构建特征,且在多个分支之间共享卷积核。实验阶段在多个数据集上验证了模型的有效性,相较于现有方法,该模型计算资源消耗更小,推理速度更快,整体性能更好。; 关键词深度学习计算机视觉场景文字检测; Keywords Deep learning Computer vision Scene text detection; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于FCN的多方向自然场景文字检测方法被引量：13: 3; 作者杨剑锋王润民何璇李秀梅钱盛友; 机构湖南师范大学信息科学与工程学院湖南师范大学物理与电子科学学院; 出处《计算机工程与应用》 CSCD 北大核心 2020年第2期164-170,共7页; 基金国家自然科学基金（No.61502164）湖南省自然科学基金青年项目（No.2016JJ3090）湖南省教育厅优秀青年项目（No.16B155）; 文摘传统的自然场景文字检测方法所采用的手工设计特征在应对复杂自然场景时缺乏鲁棒性。针对复杂自然场景中的多方向文字检测问题,提出了一种新的基于深度学习文字检测方法,采用全卷积网络(Fully Convolutional Networks,FCN)并融合多尺度文字特征图,结合语义分割的方法分割文字候选区域,利用分割得到的文字候选区域直接获取文字候选检测框并进行扩大补偿处理,对文字候选检测框进行后处理得到最终检测结果。该方法在ICDAR2013、ICDAR2015标准数据集进行了测评,实验结果表明该方法相比一些最新方法取得了更好的性能。; 关键词自然场景文字检测深度学习全卷积网络语义分割; Keywords natural scene text detection deep learning Fully Convolutional Networks(FCN) semantic segmentation; 分类号 TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于改进Mask R-CNN的越南场景文字检测: 4; 作者俸亚特文益民; 机构桂林电子科技大学计算机与信息安全学院广西图像图形与智能处理重点实验室(桂林电子科技大学); 出处《计算机应用》 CSCD 北大核心 2021年第12期3551-3557,共7页; 基金国家自然科学基金资助项目(61866007) 广西自然科学基金资助项目(2018GXNSFDA138006) +1 种基金广西学位与研究生教育改革项目(JGY2017055)。; 文摘针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络MaskR-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并将文字区域的掩码矩阵大小从14×14调整为14×28以更好地适应文字区域。针对用常规非极大值抑制(NMS)算法不能剔除重复文字检测框的问题,设计了一个针对文字区域的文本区域过滤模块并添加在检测模块之后,以有效地剔除冗余检测框。使用模型联合训练的方法训练网络,训练过程包含两部分:第一部分为特征金字塔网络(FPN)和区域生成网络(RPN)的训练,训练使用的数据集为大规模公开的拉丁文字数据,目的是增强模型在不同场景下提取文字的泛化能力;第二部分为候选框坐标回归模块和区域分割模块的训练,此部分模型参数使用像素级标注的越南场景文字数据进行训练,使模型能对包括声调符号的越南文字区域进行分割。大量交叉验证实验和对比实验结果表明,与MaskR-CNN相比,所提算法在不同的交并比(IoU)阈值下都具有更好的准确率与召回率。; 关键词 MaskR-CNN 越南场景文字检测声调符号模型联合训练分割模型重复检测; Keywords Mask R-CNN Vietnamese scene text detection tone mark model joint training segmentation model duplicate detection; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名场景文字识别技术研究综述被引量：20: 5; 作者王德青吾守尔·斯拉木许苗苗; 机构新疆大学信息科学与工程学院新疆大学新疆多语种信息技术重点实验室; 出处《计算机工程与应用》 CSCD 北大核心 2020年第18期1-15,共15页; 基金国家自然科学基金(No.61433012) 国家重点研发计划项目子课题(No.2017YFC0820702-3)。; 文摘对文字检测和识别技术进行了全面的介绍。介绍了自然场景文字识别技术的研究背景、应用领域、技术难点等;介绍了场景文字识别的预处理技术及流程,介绍了近年来出现的基于深度学习的通用检测网络、维吾尔文和中英文的深度学习文字检测网络、场景文字识别深度学习网络、端到端场景文字检测与识别深度学习网络,并总结了各类网络的结构特点、优势、局限性、应用场景以及实现成本,接着进行了综合分析;最后介绍了公开数据集,并探讨了场景文字识别技术的发展趋势及可能的研究方向。; 关键词场景文字检测文本识别深度学习端到端检测识别; Keywords scene text detection text recognition deep learning end-to-end detection and recognition; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名面向混叠文字检测的单向投影Transformer方法被引量：2: 6; 作者冯智达陈黎; 机构武汉科技大学计算机科学与技术学院智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学); 出处《计算机应用》 CSCD 北大核心 2022年第12期3686-3691,共6页; 基金国家自然科学基金资助项目(61773297)。; 文摘针对基于分割的文字检测方法在混叠文字场景下性能下降的问题,提出了单向投影Transformer(SDPT)用于混叠文本检测。首先,使用深度残差网络(ResNet)和特征金字塔网络(FPN)提取并融合多尺度特征;然后,利用水平投影将特征图投影成向量序列,并送入Transformer模块进行建模,以挖掘文本行与行之间的关系;最后,使用多目标来进行联合优化。在合成数据集BDD-SynText和真实数据集RealText上进行了大量实验,结果表明,所提SDPT在高混叠度的文字检测下取得了最优的效果,而与PSENet等文本检测算法在相同骨干网络(ResNet50)条件下相比,在BDD-SynText上F1-Score(IoU75)至少提高了21.36个百分点,在RealText上的F1-Score(IoU75)至少提高了18.11个百分点,验证了所提方法对于混叠文字检测性能改善的重要作用。; 关键词计算机视觉深度学习场景文字检测混叠文字投影 Transformer算法; Keywords computer vision deep learning scene text detection aliasing text projection Transformer algorithm; 分类号 TP391.4 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名适用于文字检测的候选框提取算法被引量：2: 7; 作者朱盈盈张拯章成全张兆翔白翔刘文予; 机构华中科技大学电子信息与通信学院中国科学院自动化研究所类脑智能研究中心; 出处《数据采集与处理》 CSCD 北大核心 2017年第6期1097-1106,共10页; 基金国家自然科学基金优秀青年基金(61222308)资助项目国家自然科学基金重点(61733007)资助项目 +3 种基金国家自然科学基金(61573160 61572207)资助项目华中科技大学自主创新基金资助项目; 文摘在文字检测的相关研究中,针对文字的候选框提取方法并未得到广泛关注与深入挖掘。一方面由于文字本身结构和一般物体具有较强的差异性,另一方面由于文字对检测的精度要求高。本文提出了一种针对文字的候选框提取算法,该算法首先利用全卷积网络进行快速预测文字区域,有效地减少了候选框的搜索范围,然后针对文字特性对EdgeBox算法进行改进,使之适用于自然场景文字候选框的提取。此外,本文在两个自然场景文字检测的标准数据集上对该算法进行了评测,并与其他已有的候选框提取方法进行了比较。实验结果表明本文方法相较其他算法,具有更好的性能和鲁棒性。; 关键词物体候选框自然场景文字检测全卷积网络 EdgeBox; Keywords object proposal scene text detection fully convolutional network EdgeBox; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	注意力机制在自然场景文字检测中的应用	王延昭顾晓东	《计算机辅助设计与图形学学报》 EI CSCD 北大核心	2021	14	在线阅读下载PDF 职称材料
2	基于RetinaNet的场景文字检测算法	金灵张轶	《计算机应用与软件》北大核心	2022	3	在线阅读下载PDF 职称材料
3	基于FCN的多方向自然场景文字检测方法	杨剑锋王润民何璇李秀梅钱盛友	《计算机工程与应用》 CSCD 北大核心	2020	13	在线阅读下载PDF 职称材料
4	基于改进Mask R-CNN的越南场景文字检测	俸亚特文益民	《计算机应用》 CSCD 北大核心	2021	0	在线阅读下载PDF 职称材料
5	场景文字识别技术研究综述	王德青吾守尔·斯拉木许苗苗	《计算机工程与应用》 CSCD 北大核心	2020	20	在线阅读下载PDF 职称材料
6	面向混叠文字检测的单向投影Transformer方法	冯智达陈黎	《计算机应用》 CSCD 北大核心	2022	2	在线阅读下载PDF 职称材料
7	适用于文字检测的候选框提取算法	朱盈盈张拯章成全张兆翔白翔刘文予	《数据采集与处理》 CSCD 北大核心	2017	2	在线阅读下载PDF 职称材料