期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于双向多层级交互网络的肺部CT图像分类
1
作者 龙肖 黄巍 胡凯 《计算机科学》 北大核心 2025年第S1期85-90,共6页
近年来,基于局部窗口的Self-Attention机制在视觉分类任务中表现突出。然而,由于存在感受野有限和建模能力弱的问题,其在处理复杂数据时效果不佳。肺部CT图像中的特征复杂多样,包括结节的形状、大小、密度等,给深入挖掘数据中的深层次... 近年来,基于局部窗口的Self-Attention机制在视觉分类任务中表现突出。然而,由于存在感受野有限和建模能力弱的问题,其在处理复杂数据时效果不佳。肺部CT图像中的特征复杂多样,包括结节的形状、大小、密度等,给深入挖掘数据中的深层次特征带来挑战。针对这些问题,文中提出了一个全新的双向多层级交互网络模型Bi-directional Multi-level Interaction Vision Transformer(Bi-MI ViT)。该网络通过双向多层级交互机制有效融合空间和通道信息,从而显著提升特征提取的准确性和全面性。在Transformer分支中,引入了高效的级联组注意力机制,旨在丰富注意力头特征的多样性,并增强模型对关键信息的捕捉能力。同时,在卷积神经网络(Convolutional Neural Networks,CNNs)分支中,通过设计DP block,并利用点卷积(Point-Wise Convolution,PW)和深度卷积(Depth-Wise Convolution,DW)深入挖掘局部信息,以优化模型的表达能力。此外,深度特征提取模块(Deep Feature Extraction,DFE)的建立增强了特征传播和复用,提高了数据利用效率,实现了实质性的性能改进。实验结果显示,在公开的COVID19-CT数据集和私有的LUAD-CT数据集上,所提算法优于对比的8种方法,实现了准确分类。 展开更多
关键词 肺部CT图像 双向多层级交互 卷积神经网络 TRANSFORMER 分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部