目的基于深度学习训练图像分类模型,研究其用于肝脏多参数磁共振成像(multi-parameter magnetic resonance imaging,mpMRI)序列分类的可行性。材料与方法回顾性收集2022年11月16日至2023年6月29日期间1676例患者的1744次肝脏mpMRI作为...目的基于深度学习训练图像分类模型,研究其用于肝脏多参数磁共振成像(multi-parameter magnetic resonance imaging,mpMRI)序列分类的可行性。材料与方法回顾性收集2022年11月16日至2023年6月29日期间1676例患者的1744次肝脏mpMRI作为模型构建数据集,共纳入25365个独立图像序列,将序列数据按照8∶1∶1的比例随机分为训练集[序列数(number of series,ns)=20207]、调优集(ns=2664)和测试集(ns=2494),基于3D ResNet训练序列分类模型,模型输入端为图像数据,输出端为序列类别,包括:T1WI同相位、T1WI反相位、T2WI脂肪抑制序列、高b值扩散加权成像(diffusion-weighted imaging,DWI)、表观扩散系数图以及动态增强扫描的增强前、动脉期、门脉期、延迟期图像。使用癌症基因组图谱-肝细胞癌(The Cancer Genome Atlas Liver Hepatocellular Carcinoma,TCGA-LIHC)数据集作为模型外部验证集,共纳入38例患者的59次mpMRI检查。影像医生判断的图像类别作为金标准,利用混淆矩阵对模型分类效能进行评价。结果在总体分类评价水平上,模型构建数据集的平均准确率、宏F1(macro-F1)、微F1(micro-F1)分别为97.2%~99.0%、0.949~0.982、0.960~0.985。在单序列分类水平上,模型构建数据集每个序列类别的准确率为89.6%~100.0%,敏感度为81.0%~100.0%,特异度为98.2%~100.0%,F1分数为0.797~1.000。在外部验证集中,模型对各序列分类的平均准确率、宏F1和微F1分别为91.6%、0.819、0.816,在单序列分类水平,模型预测的准确率、敏感度、特异度、F1分数分别为74.1%~99.4%、55.4%~100.0%、92.8%~100.0%、0.579~0.968。结论基于深度学习对肝脏mpMRI序列进行分类具有较高的准确率,可实现对肝脏mpMRI图像的自动序列分类。展开更多
文摘目的基于深度学习训练图像分类模型,研究其用于肝脏多参数磁共振成像(multi-parameter magnetic resonance imaging,mpMRI)序列分类的可行性。材料与方法回顾性收集2022年11月16日至2023年6月29日期间1676例患者的1744次肝脏mpMRI作为模型构建数据集,共纳入25365个独立图像序列,将序列数据按照8∶1∶1的比例随机分为训练集[序列数(number of series,ns)=20207]、调优集(ns=2664)和测试集(ns=2494),基于3D ResNet训练序列分类模型,模型输入端为图像数据,输出端为序列类别,包括:T1WI同相位、T1WI反相位、T2WI脂肪抑制序列、高b值扩散加权成像(diffusion-weighted imaging,DWI)、表观扩散系数图以及动态增强扫描的增强前、动脉期、门脉期、延迟期图像。使用癌症基因组图谱-肝细胞癌(The Cancer Genome Atlas Liver Hepatocellular Carcinoma,TCGA-LIHC)数据集作为模型外部验证集,共纳入38例患者的59次mpMRI检查。影像医生判断的图像类别作为金标准,利用混淆矩阵对模型分类效能进行评价。结果在总体分类评价水平上,模型构建数据集的平均准确率、宏F1(macro-F1)、微F1(micro-F1)分别为97.2%~99.0%、0.949~0.982、0.960~0.985。在单序列分类水平上,模型构建数据集每个序列类别的准确率为89.6%~100.0%,敏感度为81.0%~100.0%,特异度为98.2%~100.0%,F1分数为0.797~1.000。在外部验证集中,模型对各序列分类的平均准确率、宏F1和微F1分别为91.6%、0.819、0.816,在单序列分类水平,模型预测的准确率、敏感度、特异度、F1分数分别为74.1%~99.4%、55.4%~100.0%、92.8%~100.0%、0.579~0.968。结论基于深度学习对肝脏mpMRI序列进行分类具有较高的准确率,可实现对肝脏mpMRI图像的自动序列分类。