-
题名多尺度稀疏图引导的视觉图神经网络
- 1
-
-
作者
张子墨
赵雪专
-
机构
新加坡国立大学人文与社会科学学院
空基信息感知与融合全国重点实验室
郑州航空工业管理学院计算机学院
哈尔滨工业大学重庆研究院
航空航天电子信息技术河南省协同创新中心(郑州航空工业管理学院)
-
出处
《计算机应用》
北大核心
2025年第7期2188-2194,共7页
-
基金
河南省重点研发专项(231111212000)
河南省杰出外籍科学家工作室项目(GZS2022011)
+2 种基金
航空科学基金资助项目(20230001055002)
重庆市自然科学基金资助项目(CSTB2023NSCQ-MSX0070)
河南省科技攻关项目(232102210054)。
-
文摘
近年来,视觉图神经网络(ViG)在计算机视觉领域引起了研究人员的广泛关注,其中构图是ViG的重要建模方式。目前流行的K近邻(KNN)构图方法尺度单一、具有二次计算复杂度并且难以建模图像的局部和多尺度信息。为了解决该问题,提出一种尺度稀疏图的构筑方法——MSSG(Multi-Scale Sparse Graph)。该方法将KNN图沿通道分解为3个不同尺度的稀疏子图,具有线性的计算复杂度并且能实现图像局部信息和多尺度信息的有效建模。为了增强模型的全局建模能力,提出一种全局和局部多尺度信息融合策略。基于以上方法,提出一种视觉架构——MSViG(Multi-Scale Vision Graph neural network)。在ImageNet-1K数据集上进行的图像分类实验的结果表明,MSViG优于传统的ViG。例如,与视觉神经网络ViG-T相比,所提MSViG-T的Top-1分类准确率提高了2.1个百分点,并且在目标检测和实例分割视觉下游任务上MSViG相较于传统ViG取得了较大的性能提升。
-
关键词
图神经网络
视觉图神经网络
视觉骨干网络
图像分类
目标检测
实例分割
-
Keywords
Graph Neural Network(GNN)
Vision Graph neural network(ViG)
vision backbone
image classification
object detection
instance segmentation
-
分类号
TP212
[自动化与计算机技术—检测技术与自动化装置]
-