目的基于机器学习算法识别心血管手术患者术后呼吸衰竭(postoperative respiratory failure,PORF)的危险因素,并构建特异性的风险预测模型。方法回顾性的纳入INSPIRE数据库2011到2020年间行心血管手术的1623例患者,进行数据质量分析后,...目的基于机器学习算法识别心血管手术患者术后呼吸衰竭(postoperative respiratory failure,PORF)的危险因素,并构建特异性的风险预测模型。方法回顾性的纳入INSPIRE数据库2011到2020年间行心血管手术的1623例患者,进行数据质量分析后,使用多重插补处理缺失数据,并采用Boruta筛选相关特征变量。基于筛选指标构建8种机器学习模型,包括GBM、GLM、XGBoost、KNN、NNET、NB、SVM及RF,以曲线下面积(area under the curve,AUC)、灵敏度、特异性等指标评估模型性能,并基于排列重要性算法识别对PORF有重要影响的变量。结果PORF总体发生率为27.05%(439/1623),PORF组患者院内死亡率显著高于非PORF组(12.98%vs.1.60%,P<0.001)。建立的预测模型中,SVM模型效果较好,在测试集中,该模型AUC达到0.705,其灵敏度、特异度、阳性和阴性预测值分别为0.481、0.825、0.504、0.812。根据特征重要性计算,对术后呼吸衰竭预测影响最大的前十个变量为麻醉时长、动脉血二氧化碳分压、钙、淋巴细胞百分比、体外循环时长、术中出血量、年龄、肌酐、天门冬氨基酸氨基转移酶和活化部分凝血活酶时间。结论本研究成功构建了预测心血管手术患者术后呼吸衰竭的模型,该模型可以识别出高危患者及其发生呼吸衰竭的概率,促进数据驱动的临床决策。展开更多
文摘目的基于机器学习算法识别心血管手术患者术后呼吸衰竭(postoperative respiratory failure,PORF)的危险因素,并构建特异性的风险预测模型。方法回顾性的纳入INSPIRE数据库2011到2020年间行心血管手术的1623例患者,进行数据质量分析后,使用多重插补处理缺失数据,并采用Boruta筛选相关特征变量。基于筛选指标构建8种机器学习模型,包括GBM、GLM、XGBoost、KNN、NNET、NB、SVM及RF,以曲线下面积(area under the curve,AUC)、灵敏度、特异性等指标评估模型性能,并基于排列重要性算法识别对PORF有重要影响的变量。结果PORF总体发生率为27.05%(439/1623),PORF组患者院内死亡率显著高于非PORF组(12.98%vs.1.60%,P<0.001)。建立的预测模型中,SVM模型效果较好,在测试集中,该模型AUC达到0.705,其灵敏度、特异度、阳性和阴性预测值分别为0.481、0.825、0.504、0.812。根据特征重要性计算,对术后呼吸衰竭预测影响最大的前十个变量为麻醉时长、动脉血二氧化碳分压、钙、淋巴细胞百分比、体外循环时长、术中出血量、年龄、肌酐、天门冬氨基酸氨基转移酶和活化部分凝血活酶时间。结论本研究成功构建了预测心血管手术患者术后呼吸衰竭的模型,该模型可以识别出高危患者及其发生呼吸衰竭的概率,促进数据驱动的临床决策。