-
题名基于多特征融合的食品图像分类
- 1
-
-
作者
叶志鹏
姜枫
-
机构
南京理工大学泰州科技学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第12期254-264,共11页
-
基金
江苏省高等学校自然科学研究面上项目(19KJB520038)
江苏省“333人才工程”项目。
-
文摘
随着生活水平的提升,人们对健康饮食的需求与日俱增,食品图像识别成为热门研究课题之一。食品加工和烹饪过程的不同造成了同类食品的形状和颜色存在差异,不同类别的食品也可能会呈现相似的视觉特征,因此食品图像的识别较一般图像识别难度更大。为了解决上述问题,提出基于多特征融合的食品图像分类网络MTFNet。首先,将图像的RGB彩色通道数据与局部二值模式(LBP)对应的纹理特征相融合作为骨干挤压和激励网络(SENet)的输入。接着,利用细节注意力模块挖掘不同位置上各通道的权重,进而对各层特征图进行局部增强,提升特征图局部表征能力。然后,利用自注意力机制计算特征图各通道之间的自注意力权重,挖掘特征图间的相关性,提取图像的全局特征。最后,将局部增强特征和全局特征拼接融合后进行图像分类。实验结果表明,在食品图像数据集ETH Food101、ChineseFoodNet和ISIA Food-500上,与目前最佳的多尺度拼图重构网络(MJR-Net)模型相比,MTFNet模型的Top-1准确率分别提高了0.44、1.01和0.66个百分点,取得了更好的识别性能。
-
关键词
食品图像分类
局部二值模式
挤压和激励网络
细节注意力
自注意力
-
Keywords
food image classification
Local Binary Pattern(LBP)
Squeeze and Excite Network(SENet)
detail attention
self-attention
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-