-
题名高原脱适应症发生风险预测模型的构建与验证
- 1
-
-
作者
丁宇
王泽军
谢佳新
赵思雨
张钢
-
机构
陆军军医大学(第三军医大学)高原军事医学系寒区医学教研室
陆军军医大学(第三军医大学)高原军事医学系高原作业医学教研室
医大学(第三军医大学)高原军事医学系极端环境医学教育部重点实验室
-
出处
《陆军军医大学学报》
北大核心
2025年第1期20-29,共10页
-
基金
国家自然科学基金青年基金(82001991)。
-
文摘
目的应用不同机器学习算法构建从高原返回平原人群高原脱适应症(high altitude deacclimatization syndrome,HADAS)发病的风险预测模型,并验证其预测效能。方法于2020年11月至2024年2月对结束高原生活返回内地的人群实地或线上发放问卷调查。收集基本资料、慢性高原病(chronic mountain sickness,CMS)情况和脱适应症状等调查资料,经筛选最终纳入1095例作为建模组。阳性事件定义为脱适应症状评分>5分。将建模组按7∶3随机分为训练集(n=766)和内部测试集(n=329),采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归筛选自变量,基于多因素Logistic回归(multiple factor logistic regression,LR)、决策树(decision tree,DT)、随机森林(random forest,RF)、极端梯度提升(eXtreme gradient boosting,XGB)、支持向量机(support vector machine,SVM)、K最邻近(K-nearest neighbor,KNN)、轻度梯度提升(light gradient boosting,LGB)、朴素贝叶斯(naïve bayes,NB)8种机器学习方法构建预测模型。采用受试者工作特性曲线(receiver operating characteristic,ROC)、校准曲线和混淆矩阵对模型进行比较并进行内部测试;使用列线图或Shapley加性解释(shapley additive explanations,SHAP)图对最终模型进行展示。于2024年8月收集筛选结束高原生活返回平原132例作为外部验证组,对模型进行外部验证。结果1095例调查人群中有脱适应症者549人(50.14%)。CMS评分、年龄、高原居住时间为LASSO回归筛选出的预测因子。8种机器学习算法建立的HADAS预测模型中,以LR模型最优,ROC的曲线下面积(area under curve,AUC)训练集为0.819(95%CI:0.789~0.850),内部测试集为0.841(95%CI:0.799~0.884),F1评分内部测试集为0.801,内部测试集的AUC、F1得分在8个模型中均为最大;LR模型校准曲线的Spiegelhalter Z检验显示训练集P=0.703、内部测试集P=0.281;LR模型外部验证集AUC为0.867(95%CI:0.765~0.969)。结论以CMS评分、年龄和高原居住时间为预测因子建立的LR模型在内部测试集的综合表现最好,在外部验证集中区分度好,构建的列线图便于应用。
-
关键词
预测模型
高原脱适应症
机器学习
列线图
-
Keywords
prediction model
high altitude de-acclimatization syndrome
machine learning
nomogram
-
分类号
R195.4
[医药卫生—卫生统计学]
R363.22
[医药卫生—病理学]
R594.3
[医药卫生—内科学]
-