-
题名多层次特征融合与注意力机制的文本检测
被引量:6
- 1
-
-
作者
骆文莉
吴秦
-
机构
江南大学人工智能与计算机学院
江南大学江苏省模式识别与计算智能工程实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第4期815-821,共7页
-
基金
国家自然科学基金项目(61972180)资助。
-
文摘
卷积神经网络在自然场景文本检测中的应用,大大提高了文本检测的准确性.但由相机视角和文本本身引起的尺度多变性以及文本分布的多样性仍然给文本检测带来了挑战.从解决文本尺度多变性的角度出发,本文提出了一个新的多层次特征融合模块,在特征金字塔融合不同层级特征的同时,额外添加了一个空洞卷积池化模块分支,在不降低特征尺度的同时拥有不同的感受野,获取了更丰富的特征,有利于缓解文本尺度多变性的问题.本文通过特征注意力机制进一步提取更加适合于文本的特征,有效地实现了不同通道间信息的交互,缓解了因文本分布多样性而带来的检测难题.本文进一步提升了文本检测器的准确率,在ICDAR2015,CTW1500,Total-Text,MSRA-TD500这四个数据集上的实验结果证明了本文所提方法的有效性.
-
关键词
自然图像中的文本检测
尺度多变性
注意力机制
特征融合
空洞卷积
-
Keywords
scene text detection
scale variability
attention mechanism
feature fusion
dilated convolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名多通道融合分组卷积神经网络的人群计数算法
被引量:4
- 2
-
-
作者
严芳芳
吴秦
-
机构
江南大学江苏省模式识别与计算智能工程实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第10期2200-2205,共6页
-
基金
国家自然科学基金项目(61972180)资助
江苏省自然科学基金项目(BK20181341)资助。
-
文摘
相机视角引起的头部尺度多变性和人群分布的多样性是图像人群计数中存在的两个主要挑战,很多方法试图通过采用多列或者多分支网络来解决这些问题,但由于受列数或分支数的限制,提取的特征尺度有限.本文提出一种面向人群计数的多通道融合分组卷积神经网络,该网络主要由两个部分组成:采用预训练的VGG网络前10层作为基础主干网络,以多通道融合分组卷积模块作为网络的第二部分,多通道融合分组卷积模块是本网络的关键组成部分,该模块中每个分组卷积模块都与其他层之间密集相连以获得不同层次的特征,同时,我们引入分组卷积来减少网络参数.在三个公开的数据集(ShanghaiTech,UCFCC50,UCFQNRF)上进行验证,实验结果证明了本文所提方法的有效性.
-
关键词
人群计数
尺度多变性
分布多样性
特征融合
分组卷积
-
Keywords
crow d counting
scale variability
distribution diversity
feature fusion
group convolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-