-
题名基于双向多层级交互网络的肺部CT图像分类
- 1
-
-
作者
龙肖
黄巍
胡凯
-
机构
湘潭大学计算机学院·网络空间安全学院
湖南省长沙市第一医院放射科计算机医学图像处理研究中心
-
出处
《计算机科学》
北大核心
2025年第S1期85-90,共6页
-
基金
国家自然科学基金(62272404)
湖南省自然科学基金(2022JJ30571)
+3 种基金
湖南省科技厅项目(2021SK53105)
湖南省教育厅项目(23A0146)
湖南省大学生创新创业训练计划项目(S202310530178)
湖南省普通本科高校教学改革研究项目(202401000574)。
-
文摘
近年来,基于局部窗口的Self-Attention机制在视觉分类任务中表现突出。然而,由于存在感受野有限和建模能力弱的问题,其在处理复杂数据时效果不佳。肺部CT图像中的特征复杂多样,包括结节的形状、大小、密度等,给深入挖掘数据中的深层次特征带来挑战。针对这些问题,文中提出了一个全新的双向多层级交互网络模型Bi-directional Multi-level Interaction Vision Transformer(Bi-MI ViT)。该网络通过双向多层级交互机制有效融合空间和通道信息,从而显著提升特征提取的准确性和全面性。在Transformer分支中,引入了高效的级联组注意力机制,旨在丰富注意力头特征的多样性,并增强模型对关键信息的捕捉能力。同时,在卷积神经网络(Convolutional Neural Networks,CNNs)分支中,通过设计DP block,并利用点卷积(Point-Wise Convolution,PW)和深度卷积(Depth-Wise Convolution,DW)深入挖掘局部信息,以优化模型的表达能力。此外,深度特征提取模块(Deep Feature Extraction,DFE)的建立增强了特征传播和复用,提高了数据利用效率,实现了实质性的性能改进。实验结果显示,在公开的COVID19-CT数据集和私有的LUAD-CT数据集上,所提算法优于对比的8种方法,实现了准确分类。
-
关键词
肺部CT图像
双向多层级交互
卷积神经网络
TRANSFORMER
分类
-
Keywords
Lung CT images
Bi-directional multi-layer interaction
Convolutional neural network
Transformer
Classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-