-
题名基于自适应三线性池化网络的细粒度图像分类
被引量:3
- 1
-
-
作者
石进
徐杨
曹斌
-
机构
贵州大学大数据与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第5期239-246,254,共9页
-
基金
贵州省科技计划项目(黔合科支撑[2021]一般176)。
-
文摘
细粒度图像分类的关键在于提取图像中微妙的特征。现有基于弱监督方式的细粒度图像识别方法大多使用专家标注的边界注释辅助定位关键区域,存在标注成本高、训练过程复杂等问题。基于弱监督的双线性卷积神经网络方法因其学习到的特征空间更符合细粒度图像特性而具有一定的有效性,但忽略了层间的相互作用。针对细粒度图像识别领域存在的关键区域识别困难和层间交互关联弱的问题,融合二阶协方差通道注意力机制、自适应特征掩码与自适应三线性池化,提出自适应三线性池化网络ATP-Net,用于细粒度图像分类任务。通过二阶协方差通道注意力机制学习通道上的注意力向量,构建自适应特征掩码模块学习空间维上的注意力矩阵,设计自适应三线性池化模块学习特征的最终表示,以充分利用空间维、通道维上的信息。在CUB-200、Cars-196和Aircraft-1003个细粒度图像分类数据集上的实验结果表明,ATP-Net的分类精度分别为89.30%、94.20%和91.80%。
-
关键词
细粒度图像分类
注意力机制
特征掩码
自适应三线性池化
高阶交互
-
Keywords
Fine-Grained Image Categorization(FGIC)
attention mechanism
feature mask
Adaptive Trilinear Pooling(ATP)
Higher-Order Interaction(HOI)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-