期刊文献+
共找到1,400篇文章
< 1 2 70 >
每页显示 20 50 100
居民健康不平等预测模型构建及影响因素研究——基于机器学习的证据 被引量:1
1
作者 苏敏 赵文菲 李政蓉 《卫生经济研究》 北大核心 2025年第7期23-29,35,共8页
当前,我国仍面临显著的健康不平等问题,迫切需要识别影响居民健康不平等的关键因素。对此,引入“样本外预测”的思路,基于健康社会决定因素的分层模型纳入预测因子,结合多种机器学习算法,构建高维预测模型,评估多维因素对居民健康不平... 当前,我国仍面临显著的健康不平等问题,迫切需要识别影响居民健康不平等的关键因素。对此,引入“样本外预测”的思路,基于健康社会决定因素的分层模型纳入预测因子,结合多种机器学习算法,构建高维预测模型,评估多维因素对居民健康不平等的预测能力。研究发现,随机森林模型的预测性能最佳,年龄、个人总收入、受教育程度、职业类型和家庭经济状况是最具预测能力的变量,与居民健康不平等之间存在非线性及复杂交互关系;建议针对不同人群的具体需求制定差异化的健康政策,以有效缓解健康不平等,最终推动人口健康和社会可持续发展。 展开更多
关键词 健康不平等 机器学习 预测模型
在线阅读 下载PDF
基于不同机器学习方法构建非心脏手术老年患者术后谵妄预测模型
2
作者 石金云 陈荣 +2 位作者 李文媛 纪木火 李青 《临床麻醉学杂志》 北大核心 2025年第3期240-245,共6页
目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等... 目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等共102个变量。采用单因素分析初步筛选危险因素,将有统计学差异(P<0.05)的变量纳入最小绝对收缩与选择算子(LASSO)筛选特征变量,应用随机森林(RF)、支持向量机(SVM)、自适应增强算法(Adaboost)和神经网络(NN)4种机器学习方法构建POD预测模型,采用受试者工作特征曲线下面积(AUROC)、精确度-召回率(PR)曲线的平均精度(AP)、Brier评分等对模型进行综合评估,引入Shapley加性解释(SHAP)对最优机器学习模型进行可解释化分析。结果有155例(17%)患者发生POD,经LASSO回归分析后,确定10个特征变量用于构建机器学习模型。4种机器学习模型中,RF的AUROC最高为0.90(95%CI 0.86~0.93),AP为0.8,Brier评分为0.086。SHAP模型解释性分析显示,对POD贡献度最高的是手术时间。结论在应用4种机器学习方法构建的非心脏手术老年患者POD预测模型中,RF的预测效能最佳。 展开更多
关键词 非心脏外科手术 术后谵妄 机器学习 预测模型 Shapley加性解释
在线阅读 下载PDF
基于机器学习算法构建青少年特发性脊柱侧凸进展风险预测模型
3
作者 李洁 赵晓峰 +3 位作者 周润田 曾琪 陈容 赵斌 《中国脊柱脊髓杂志》 北大核心 2025年第8期837-847,共11页
目的:通过机器学习算法筛选青少年特发性脊柱侧凸(adolescent idiopathic scoliosis,AIS)进展的核心预测变量,并构建风险预测模型。方法:选取山西医科大学第二医院2018年1月~2023年6月首次确诊的361例AIS患者追踪随访。收集患者基本资... 目的:通过机器学习算法筛选青少年特发性脊柱侧凸(adolescent idiopathic scoliosis,AIS)进展的核心预测变量,并构建风险预测模型。方法:选取山西医科大学第二医院2018年1月~2023年6月首次确诊的361例AIS患者追踪随访。收集患者基本资料和影像学资料,根据侧凸进展(主弯Cobb角增长≥6°)与否将患者分为进展组与非进展组,并按8∶2随机分为训练集与测试集。采用LASSO回归和随机生存森林(random survival forest,RSF)筛选侧凸进展的预测变量,并分别构建RSF模型、生存支持向量机(survival support vector machine,SSVM)模型和极限梯度提升(extreme gradient boosting,XGBoost)模型,采用C-index和综合Brier分数比较选择最优模型。使用测试集数据,采用受试者工作特征(receiver operating characteristic,ROC)曲线和曲线下面积(area under the curve,AUC)、校正C-index、校准曲线、综合Brier分数和决策曲线分析(decision curve analysis,DCA)分别对最优模型的区分度、准确度和临床应用价值进行评价。结果:361例AIS患者的侧凸进展率为41.27%,LASSO回归分析和RSF算法筛选的共同预测因子分别是:初诊Cobb角、Risser征、顶椎旋转度、脊柱增长速率、是否支具治疗、T1椎体倾斜角和顶椎偏距。RSF模型、SSVM模型和XGBoost模型的C-index为0.837、0.790和0.743,综合Brier分数为0.084、0.161和0.133。综合模型的区分度和准确度,RSF模型表现更优,其6个月、12个月、18个月和24个月的时间依赖性AUC值分别为:0.903(95%CI:0.829~0.977)、0.870(95%CI:0.756~0.985)、0.858(95%CI:0.742~0.973)和0.862(95%CI:0.728~0.997),校正C-index为0.842(95%CI:0.749~0.917),模型区分度好。校准曲线显示实际观察结果与预测结果基本一致,综合Brier分数0.084,预测准确度高。DCA显示6个月、12个月、18个月和24个月的风险阈值概率分别在5%~20%、10%~80%、10%~70%和25%~85%时,使用本模型可使患者的净受益率增加。结论:基于初诊Cobb角、Risser征、顶椎旋转度、脊柱增长速率、是否支具治疗、T1椎体倾斜角和顶椎偏距构建的RSF模型可以较为准确地预测AIS患者首次确诊后在未来不同时间点侧凸进展的风险概率。 展开更多
关键词 青少年特发性脊柱侧凸 侧凸进展 机器学习 预测模型
在线阅读 下载PDF
基于自动化机器学习构建胆总管结石自发排石预测模型及应用程序
4
作者 陈健 夏开建 +3 位作者 高福利 刘罗杰 王甘红 徐晓丹 《临床肝胆病杂志》 北大核心 2025年第3期518-527,共10页
目的鉴于胆总管结石患者治疗决策的复杂性,本研究利用自动化机器学习算法,开发一款能够预测胆总管结石患者自发排石的预测模型及应用程序,从而减少非必要内镜逆行胰胆管造影(ERCP)。方法回顾性收集2022年1月—2024年6月通过影像学手段... 目的鉴于胆总管结石患者治疗决策的复杂性,本研究利用自动化机器学习算法,开发一款能够预测胆总管结石患者自发排石的预测模型及应用程序,从而减少非必要内镜逆行胰胆管造影(ERCP)。方法回顾性收集2022年1月—2024年6月通过影像学手段明确诊断胆总管结石后拟行ERCP取石的患者数据,数据来自常熟市第一人民医院(数据集1)和常熟市中医院(数据集2),共835例。数据集1用于机器学习模型训练、内部验证和开发应用程序,数据集2用于外部测试。纳入22个潜在预测变量,用于构建和内部验证LASSO回归模型及自动化机器学习模型。通过受试者操作特征曲线下面积(AUC)、敏感度、特异度、准确率等评估模型性能,选取最佳模型。使用特征重要性图、力图和SHAP图对模型进行解释。利用Python Dash库和最佳模型构建Web应用程序,在数据集2上进行外部测试。使用Kolmogorov-Smirnov检验确定数据是否符合正态分布;对于不符合正态分布的连续变量,使用Mann-Whitney U检验进行2组间比较;分类变量通过χ^(2)检验或Fisher精确检验来分析组间差异。结果纳入835例患者中,152例(18.20%)出现自发排石。在训练集(n=588)和验证集(n=171)中,LASSO模型的AUC分别为0.875、0.864,重要性排名前5的预测因素为单发胆总管结石、胆总管不扩张、胆总管结石直径、血清ALP降低和GGT降低。通过自动化机器学习构建了55个模型,其中梯度提升机(GBM)表现最佳,其AUC为0.891,95%CI为0.859~0.927,优于极端随机树(XRT)、深度学习(DL)、广义线性模型(GLM)和分布式随机森林(DRF)模型。在测试集(n=76)中,GBM模型的预测准确率、敏感度和特异度分别为0.855、0.846和0.857。变量重要性分析显示,单发胆总管结石、胆总管不扩张、胆总管结石直径<8 mm、血清ALP降低和GGT降低这5个因素对预测自发排石具有重要影响。基于GBM模型的SHAP图分析显示,当患者出现单发胆总管结石、胆总管不扩张、胆总管结石直径<8 mm、血清ALP及GGT降低时,出现自发性排石的概率明显增加。结论基于自动化机器学习算法构建的GBM模型及应用程序,在预测胆总管结石患者自发排石方面展现出良好的预测性能和使用便捷性。该应用程序能够帮助避免非必要的ERCP,从而降低手术风险和医保支出。 展开更多
关键词 胆总管结石病 胰胆管造影术 内窥镜逆行 机器学习 预测模型
在线阅读 下载PDF
端到端机器学习代理模型构建及其在爆轰驱动问题中的应用
5
作者 柏劲松 刘洋 +1 位作者 陈翰 钟敏 《爆炸与冲击》 北大核心 2025年第5期19-30,共12页
人工智能/机器学习方法能够发现数据中隐藏的物理规律,构建状态参数与动态结果之间端到端的代理模型,可高效解决强耦合、非线性、多物理等复杂工程问题。在高度非线性的爆炸与冲击动力学领域,选择了一个经典的爆轰驱动问题作为研究对象... 人工智能/机器学习方法能够发现数据中隐藏的物理规律,构建状态参数与动态结果之间端到端的代理模型,可高效解决强耦合、非线性、多物理等复杂工程问题。在高度非线性的爆炸与冲击动力学领域,选择了一个经典的爆轰驱动问题作为研究对象,以数值模拟结果作为机器学习代理模型的训练数据,将正向模拟与逆向设计有机结合起来,基于深度神经网络技术,构建了特征位置速度剖面、材料动态变形与工程因素之间端到端的代理模型,给出了代理模型的计算精确度,验证了代理模型从速度剖面反演工程因素的能力。结果表明:端到端代理模型具有较高的预测能力,其预测的速度剖面与工程因素估计的相对误差均小于1%,可用于高度非线性的爆炸与冲击动力学问题的快速设计、高精度预测和敏捷迭代。 展开更多
关键词 计算爆炸力学 爆轰驱动 人工智能 机器学习 端到端代理模型 深度神经网络
在线阅读 下载PDF
多模态数据融合+动态机器学习构建ICU患者MDRO感染早期预警模型的研究 被引量:2
6
作者 左蝶 赵佳 +4 位作者 龙晓艳 马学先 刘冰 王小燕 李萍 《海南医科大学学报》 北大核心 2025年第6期421-432,共12页
目的:多模态数据融合+动态机器学习构建ICU患者多重耐药菌(multi-drug resistant organism,MDRO)感染风险预测模型,优选出最优预测模型为医院MDRO感染提供有效的评估工具。方法:选取某三甲医院ICU 2018年1月1日~2023年8月30日的1200名患... 目的:多模态数据融合+动态机器学习构建ICU患者多重耐药菌(multi-drug resistant organism,MDRO)感染风险预测模型,优选出最优预测模型为医院MDRO感染提供有效的评估工具。方法:选取某三甲医院ICU 2018年1月1日~2023年8月30日的1200名患者,按照8∶2的比例随机分为训练集(n=960)和测试集(n=240),基于单因素分析将P<0.05的变量作为构建模型的纳入因素,运用随机森林(RF)、极度梯度提升(XGBoost)、决策树中的分类与回归树(classification and regression trees,CART)和logistic回归分别建立ICU患者MDRO感染风险预测模型,通过准确率、灵敏度、特异度、阳性预测值、阴性预测值、Kappa值、AUC值、决策曲线和校准曲线对4种模型的预测性能进行比较。结果:RF模型在训练集和测试集中表现最佳,其准确率、灵敏度、特异度、阳性预测值、阴性预测值及Kappa值均高于其他模型。AUC值从大到小顺序排列,训练集:RF>XGBoost>CRAT>logistic回归;测试集:RF>CRAT>logistic回归>XGBoost。本研究结果显示肺部感染、脑血管疾病、低蛋白血症及侵入性操作为4种模型的高风险预测因子是MDRO感染筛查及进行临床干预的重要理论依据。结论:基于RF算法建立的风险预测模型对ICU患者MDRO感染风险的预测性能优于其他三个机器算法构建的模型。 展开更多
关键词 ICU患者 MDRO感染风险 机器学习 预测模型
在线阅读 下载PDF
基于机器学习算法构建老年重症病人静脉血栓栓塞症风险预测模型 被引量:1
7
作者 金杰 徐清 +4 位作者 卢洁 赵佳月 张晴 孔杨 许红梅 《护理研究》 北大核心 2025年第14期2327-2335,共9页
目的:基于机器学习算法构建老年重症病人静脉血栓栓塞症(VTE)风险预测模型。方法:选取2020年1月—2023年6月山东省3所三级甲等综合医院重症监护室(ICU)收治的909例老年重症病人作为研究对象,收集病人相关临床资料,按7∶3比例将病人随机... 目的:基于机器学习算法构建老年重症病人静脉血栓栓塞症(VTE)风险预测模型。方法:选取2020年1月—2023年6月山东省3所三级甲等综合医院重症监护室(ICU)收治的909例老年重症病人作为研究对象,收集病人相关临床资料,按7∶3比例将病人随机划分为训练集(636例)和验证集(273例)。以ICU住院期间是否发生VTE为结局变量,基于随机森林、极端梯度提升、支持向量机和梯度提升树4种机器学习算法构建预测模型。采用受试者工作特征曲线下面积(AUC)、Brier分数等指标评估模型预测效能并选出最优模型。采用SHAP算法对最优模型进行解释性分析。结果:909例老年重症病人中258例病人发生VTE,VTE发生率为28.4%。4种模型中随机森林的AUC(0.803)、准确度(0.733)、灵敏度(0.662)和特异度(0.760)均较高,Brier分数最低(0.171)。结论:基于随机森林开发的老年重症病人VTE风险预测模型有良好的预测能力,可为优化老年重症病人VTE管理提供参考。 展开更多
关键词 机器学习 老年人 重症 静脉血栓栓塞症 预测模型 随机森林
在线阅读 下载PDF
基于机器学习的乒乓球混双技战术评估模型构建与应用 被引量:1
8
作者 曹烨程 张千轶 +1 位作者 陈辉 刘敏 《河南师范大学学报(自然科学版)》 北大核心 2025年第3期149-156,I0010-I0014,共13页
在运动项目技战术分析领域引入机器学习算法,以场胜负为标签,以各段与轮次的得分率与使用率构造的得分效率密度和全局得分能力两个新指标作为特征,使用机器学习模型中的随机森林模型、LightGBM模型、XGBoost模型对乒乓球混双比赛28个技... 在运动项目技战术分析领域引入机器学习算法,以场胜负为标签,以各段与轮次的得分率与使用率构造的得分效率密度和全局得分能力两个新指标作为特征,使用机器学习模型中的随机森林模型、LightGBM模型、XGBoost模型对乒乓球混双比赛28个技战术指标的特征重要性进行排序,提取了2个二级评价指标和8个三级评价指标.最后应用构造的评估模型对王楚钦/孙颖莎与林高远/王曼昱的2场混双决赛进行了技战术分析与评价,验证了机器学习方法构建的乒乓球技战术评估模型具有较高的实用性和准确性. 展开更多
关键词 机器学习 乒乓球 技战术 评估模型
在线阅读 下载PDF
基于机器学习筛选猪活体肌内脂肪含量间接选育和构建预测模型的关键性状 被引量:2
9
作者 吴建 杨文 +2 位作者 孟孜 查成万 吴望军 《南京农业大学学报》 CAS 北大核心 2025年第1期161-170,共10页
[目的]本研究旨在探究猪断奶重、屠宰前活体重、背膘厚等性状因素对猪肌内脂肪(intramuscular fat,IMF)含量的影响,确定影响猪IMF含量的关键性状因素。[方法]以805头皮特兰×[杜洛克×(长白×大白)]四元商品猪群为试验对象... [目的]本研究旨在探究猪断奶重、屠宰前活体重、背膘厚等性状因素对猪肌内脂肪(intramuscular fat,IMF)含量的影响,确定影响猪IMF含量的关键性状因素。[方法]以805头皮特兰×[杜洛克×(长白×大白)]四元商品猪群为试验对象,记录性别,测定初生重、断奶重、屠宰前活体重和IMF含量等14个性状,然后通过相关性分析从14个性状中初步筛选出影响IMF含量的性状因素,再通过随机森林模型评估各性状因素对IMF含量影响的重要性,进一步通过LASSO回归和逐步回归筛选出影响IMF含量的关键性状因素;在此基础上,利用广义线性模型(generalized linear model,GLM)分析关键性状因素不同水平对IMF含量的影响。[结果]相关性分析结果显示,猪IMF含量与断奶重(r=0.13, P<0.001)和屠宰前活体重(r=0.22, P<0.001)呈显著相关;与不同位置背膘厚呈极显著相关(P<0.001),相关系数为0.21~0.26。另外,IMF含量与肉色红度值a*、黄度值b*、色调角H0和色度C*值也呈显著相关(P<0.05),相关系数为0.08~0.13。随机森林模型分析结果显示,胸腰结合处背膘厚对IMF含量的贡献最大,其次是屠宰前活体重。LASSO回归和逐步回归分别筛选出9个和5个显著影响IMF含量的性状因素,其中性别、断奶重、屠宰前活体重、胸腰椎结合处背膘厚4个活体可测性状为2种方法共同筛选出的关键性状因素。GLM分析结果显示,4个活体可测性状对IMF含量均具有显著影响,并且阉公猪平均IMF含量(2.52%)显著高于母猪(2.41%)(P<0.05);断奶重小于5 kg组平均IMF含量(2.24%)显著低于其他3组(P<0.05);屠宰前活体重小于85 kg组的平均IMF含量(2.27%)显著低于115 kg以上组(2.67%)(P<0.05),当屠宰前活体重大于100 kg后,各水平组间平均IMF含量差异不显著(P>0.05)。胸腰椎结合处背膘厚大于26 mm组的平均IMF含量(2.73%)显著高于其他背膘厚组(P<0.05),而5~12 mm与12~19 mm背膘厚组的平均IMF含量差异不显著(P>0.05)。[结论]本研究通过机器学习确定了性别、断奶重、屠宰前活体重和胸腰椎结合处背膘厚4个与IMF含量显著相关的活体可测定性状,并发现平均IMF含量随着屠宰前活体重和胸腰椎结合处背膘厚的增加呈明显的上升趋势。 展开更多
关键词 肌内脂肪 间接选择 模型 机器学习 活体可测定性状
在线阅读 下载PDF
基于三种机器学习方法研究骨质疏松性骨折危险因素及构建列线图预测模型 被引量:2
10
作者 云思敏 王雄毅 +5 位作者 谢伊代·如则 朱柯雨 翁程伟 郑苗 魏祺 徐又佳 《中华骨质疏松和骨矿盐疾病杂志》 北大核心 2025年第1期36-48,共13页
目的运用3种机器学习方法探讨骨质疏松症患者发生骨质疏松性骨折的危险因素,并构建列线图预测模型。方法选取2021年10月至2023年5月苏州大学附属第二医院289例骨质疏松症患者作为研究对象,按是否骨折分为骨折组(93例)和非骨折组(196例)... 目的运用3种机器学习方法探讨骨质疏松症患者发生骨质疏松性骨折的危险因素,并构建列线图预测模型。方法选取2021年10月至2023年5月苏州大学附属第二医院289例骨质疏松症患者作为研究对象,按是否骨折分为骨折组(93例)和非骨折组(196例)。采用R语言开展相关研究。运用拉索回归(least absolute shrinkage and selection operator,LASSO)、极端梯度提升(extreme gradient boosting,XGBoost)、随机森林(random forest,RF)3种机器学习方法平行评估“变量”与骨质疏松性骨折风险的相关性,分析3种机器学习方法“重叠覆盖”的风险因素,采用多因素Logisitic回归方法验证结果的独立预测性。基于机器学习和多因素Logisitic回归分析筛选出的独立危险因素构建“列线图预测模型”,采用Bootstrap方法进行内部和外部验证,通过受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)、Hosmer-Lemeshow拟合优度检验、校准曲线及决策曲线(decision curve analysis,DCA)评估列线图预测模型的准确性和临床适用性。结果3种机器学习方法各自筛选到不同风险因素,经过“重叠覆盖”分析得到6项共同的骨质疏松性骨折重要风险因素:年龄、甘油三酯、Ca、血清25羟维生素D、股骨颈T值、血清白蛋白。多因素Logistic回归分析显示其中5个因素是脆性骨折的独立危险因素:年龄(OR=1.075,95%CI:1.017~1.136,P=0.011)、甘油三酯(OR=0.207,95%CI:0.103~0.415,P<0.001)、Ca(OR=0.010,95%CI:0.000~0.602,P=0.028)、股骨颈T值(OR=0.443,95%CI:0.245~0.800,P=0.007)、血清25羟维生素D(OR=0.902,95%CI:0.830~0.980,P=0.015)。基于5个预测危险因素构建的列线图预测模型验证结果显示:模型训练集AUC值为0.934(95%CI:0.897~0.972),内部验证集的AUC值为0.893(95%CI:0.802~0.984),外部验证集的AUC值为0.849(95%CI:0.792~0.905),预测效能良好。校准曲线显示预测值与理想曲线有较好一致性。Hosmer-Lemeshow拟合优度检验(训练集:χ^(2)=9.842,P=0.276;内部验证集:χ^(2)=5.174,P=0.739;外部验证集:χ^(2)=12.828,P=0.118)表明模型有较高的预测准确性。DCA表示该模型临床效能表现良好。结论3种机器学习方法共同指出的骨质疏松性骨折高风险因素有6项,经多因素Logistic回归分析认为高龄、低甘油三酯、低Ca、低血清25羟维生素D、低股骨颈T值为独立危险因素,其中低甘油三酯、低血清25羟维生素D危险因素以往报道较少。基于3种机器学习方法构建的列线图预测模型有较好便捷性、准确性,可帮助临床医生识别骨质疏松性骨折高危患者,有益实施早期干预。 展开更多
关键词 骨质疏松性骨折 机器学习 列线图 预测模型
在线阅读 下载PDF
基于可解释机器学习方法老年脑卒中患者吞咽障碍预测模型的构建与验证
11
作者 刘韵涵 姜明明 +5 位作者 李冬梅 丁瑜 解恒革 何昆仑 周武红 程艳爽 《中华老年心脑血管病杂志》 北大核心 2025年第6期698-704,共7页
目的 基于老年脑卒中患者临床及实验室指标,利用可解释机器学习方法构建并验证卒中后吞咽障碍(post-stroke dysphagia, PSD)风险预测模型。方法 回顾性选取2010年10月至2021年12月解放军总医院第一医学中心神经内科收治的含有完整吞咽... 目的 基于老年脑卒中患者临床及实验室指标,利用可解释机器学习方法构建并验证卒中后吞咽障碍(post-stroke dysphagia, PSD)风险预测模型。方法 回顾性选取2010年10月至2021年12月解放军总医院第一医学中心神经内科收治的含有完整吞咽功能表述的老年脑卒中患者3994例,将2019年1月至2021年12月的1390例患者作为外部验证集,2010年10月至2019年1月的2604例作为训练组。将训练组按照7:3随机分为训练集1823例和内部验证集781例,根据是否发生PSD将训练组患者分为PSD组773例和非PSD组1831例。以PSD发生为终点事件,构建随机森林(random forest, RF)、极端梯度提升(eXtreme Gradient Boosting, XGBoost)、支持向量机(Support Vector Machine, SVM)和logistic回归模型,通过ROC曲线评估模型性能。优选最佳模型后,采用夏普利加性解释(SHapley Additive exPlanations, SHAP)方法量化特征。结果 PSD组肌力等级、脑卒中侧、脑损伤区域与非PSD组比较,差异有统计学意义(P<0.01),PSD组高血压、糖尿病、饮酒史、中性粒细胞水平明显高于非PSD组,血钾、血清白蛋白水平明显低于非PSD组(P<0.05,P<0.01)。多因素logistic回归分析显示,年龄、饮酒史、糖尿病、高血压、肌力等级、脑损伤区域、脑卒中侧、中性粒细胞、血清白蛋白、血钾是PSD的危险因素(P<0.05,P<0.01)。在外部验证中,RF、XGBoost、SVM、logistic回归模型验证集的曲线下面积分别为0.883、0.902、0.877、0.868。SHAP值分布显示,饮酒史、高血压、糖尿病与PSD风险呈正相关;肌力等级与风险呈负相关;年龄增长与PSD风险呈正相关;幕下损伤比幕上或全区域损伤的预测作用更强;双侧和右侧损伤较左侧损伤的PSD风险更高。结论 基于XGBoost模型构建的老年患者PSD风险预测模型性能最优。 展开更多
关键词 卒中 吞咽障碍 预测 LOGISTIC模型 算法 机器学习
在线阅读 下载PDF
基于机器学习的骨质疏松风险预测模型的构建与评价
12
作者 赵睿 吴卓青 +3 位作者 陈静锋 丁素英 陈淑琬 孙博 《郑州大学学报(医学版)》 北大核心 2025年第6期842-846,共5页
目的:采用机器学习方法探讨骨质疏松相关预测因素,并构建骨质疏松风险预测模型。方法:回顾性选取2020年5月至2021年12月于郑州大学第一附属医院健康管理中心进行健康体检的1 553例受检者为研究对象,按7∶3随机分为训练集(n=1 088)和测试... 目的:采用机器学习方法探讨骨质疏松相关预测因素,并构建骨质疏松风险预测模型。方法:回顾性选取2020年5月至2021年12月于郑州大学第一附属医院健康管理中心进行健康体检的1 553例受检者为研究对象,按7∶3随机分为训练集(n=1 088)和测试集(n=465),使用Logistic回归筛选骨质疏松预测因素,分别使用类别提升(CatBoost)、随机森林、Logistic回归、支持向量机4种机器学习方法构建模型,采用ROC曲线、校准曲线、决策曲线分析(DCA)等评估模型性能,通过特征重要性和SHAP可解释性分析讨论骨质疏松的危险因素。结果:基于性别、年龄、SBP、HbA1c、疾病史构建骨质疏松风险预测模型,其中CatBoost模型在训练集与测试集获得了最优的AUC(95%CI),分别为0.861(0.835~0.888)与0.833(0.783~0.883);校准曲线显示预测概率与实际情况相符;且DCA结果提示,当训练集与测试集中风险概率阈值<75%时,CatBoost均获得较高的净收益。模型的SHAP可解释性分析显示年龄、性别、HbA1c依次为骨质疏松预测的前三大重要特征(SHAP分别为0.127、0.028、0.006)。结论:基于CatBoost方法构建的骨质疏松风险预测模型具有较好的预测效果,可为临床早期筛查及干预提供决策依据。 展开更多
关键词 骨质疏松 机器学习 风险预测模型 预测因素
在线阅读 下载PDF
基于数理与机器学习的ZTC钛合金塑性本构模型
13
作者 赵德望 刘汉杰 +2 位作者 赵延广 樊俊铃 赵坤民 《中国有色金属学报》 北大核心 2025年第10期3539-3551,共13页
钛合金以其优异的力学性能在航空、航天等运载器设计与制造领域的应用愈发重要,是目前发展最为迅速的轻量化材料之一。本研究针对ZTC4钛合金开展了恒应变率下25~300℃范围不同温度的拉伸实验,分析了温度对其力学性能和断裂行为的影响;... 钛合金以其优异的力学性能在航空、航天等运载器设计与制造领域的应用愈发重要,是目前发展最为迅速的轻量化材料之一。本研究针对ZTC4钛合金开展了恒应变率下25~300℃范围不同温度的拉伸实验,分析了温度对其力学性能和断裂行为的影响;提出一种基于理论结合机器学习的新型本构模型构建方法,构建了ZTC4钛合金“浅层+深度”的混合神经网络模型,并计算推导出新型本构模型。结果表明,相比于经典JC本构模型,新型本构模型能够更好地预测ZTC4钛合金在不同温度下流动应力值,平均绝对相对误差不超过0.03%,均方根误差最小可达8.42。该方法为快速准确评估ZTC4钛合金或类似材料的力学性能研究提供新的解决思路。 展开更多
关键词 ZTC4钛合金 Johnson-Cook模型 机器学习 混合神经网络 新型本构模型
在线阅读 下载PDF
基于5种机器学习算法构建的怀孕概率预测模型及其性能比较
14
作者 任超 杨桓 +10 位作者 周妮娅 陈卿 周文正 王童 凌曦 孙磊 邹鹏 梁卓越 敖琳 刘晋祎 曹佳 《陆军军医大学学报》 北大核心 2025年第12期1376-1387,共12页
目的选择5种机器学习算法构建模型并比较其预测孕前社会-心理-行为因素与夫妻备孕结局关联的性能表现。方法基于重庆市孕前生殖健康与出生结局队列,选取2019年1月至2022年3月年于重庆市妇幼保健院入组的志愿者资料,队列共入组5447对夫妻... 目的选择5种机器学习算法构建模型并比较其预测孕前社会-心理-行为因素与夫妻备孕结局关联的性能表现。方法基于重庆市孕前生殖健康与出生结局队列,选取2019年1月至2022年3月年于重庆市妇幼保健院入组的志愿者资料,队列共入组5447对夫妻,以一对一问卷方式收集夫妻双方人口学和社会-心理-行为资料,共计221个变量。依据纳入排除标准,最终纳入4097对夫妇,按7∶3简单随机化法划分训练集(n=2867对)和验证集(n=1230对),采用特征分析和共线性筛除选择潜在暴露因素;考虑基层卫生机构不易开展精子质量分析,通过在训练集和验证集中同时纳入或排除精子质量,构建包含精液常规参数的特征集1和排除精液常规参数的特征集2。采用Logistic回归、朴素贝叶斯、随机森林、梯度提升机、支持向量机5种算法构建备孕结局预测模型,并采用随机搜索合并网格搜索法优化模型参数。利用精确率、召回率、FI分数、受试者工作特征曲线下面积(area under the curve,AUC)、校准曲线比较各模型预测能力,并选择最优模型,比较有或无精液常规参数情况下,问卷资料对生育结局预测能力的变化。结果特征集1共筛选得到24个变量,特征集2共筛选得到16个变量。特征集1中,梯度提升机效果较好,AUC相对较高(0.651),且F1分数表现较好(0.61);Logistic回归模型表现稳定(AUC=0.647),适合作为参照模型;随机森林(AUC=0.641)、朴素贝叶斯(AUC=0.641)和支持向量机(AUC=0.634)表现次之。特征集1中,梯度提升机验证集AUC为0.651(95%CI:0.629~0.681),预测精度为0.63,召回率为0.65,平均精确度值F1为0.61;特征集2中,其验证集AUC为0.649(95%CI:0.624~0.663),与特征集1相比未见明显降低,2个特征集校准曲线均与理想曲线接近。预测结果提示,在特征集1中,与备孕结局呈较高负相关的特征为女性年龄、男性年龄、夫妻无避孕措施1年内未怀孕;呈较高正相关的特征为女性妊娠史、精子总活力、入组前1年使用避孕措施。结论在本队列资料中对比5种机器学习算法,梯度提升机性能略优;夫妻双方共有24项因素与备孕结局关联,排除精液常规参数的简化模型性能未见明显下降。利用机器学习方法,通过社会-心理-行为问卷预测夫妻备孕结局具有可行性。 展开更多
关键词 机器学习 怀孕概率 预测模型 社会-心理-行为因素
在线阅读 下载PDF
上臂输液港并发导管相关血栓形成危险因素分析及机器学习预测模型构建
15
作者 张梦肃 张杰 +3 位作者 金光鑫 仇晓霞 张学彬 卜军 《介入放射学杂志》 北大核心 2025年第3期253-260,共8页
目的分析上臂输液港(upper arm infusion port,UAP)并发导管相关血栓形成(catheter-related thrombosis,CRT)的危险因素,构建机器学习预测模型。方法纳入2014年2月至2023年2月在上海仁济医院接受UAP植入患者6028例,并分入训练集(n=4219... 目的分析上臂输液港(upper arm infusion port,UAP)并发导管相关血栓形成(catheter-related thrombosis,CRT)的危险因素,构建机器学习预测模型。方法纳入2014年2月至2023年2月在上海仁济医院接受UAP植入患者6028例,并分入训练集(n=4219)和验证集(n=1809)。构建最小绝对收缩和选择算子(LASSO)、随机森林、决策树、神经网络、XGBoost及logistic等6种机器学习模型,选择性能较优者作为最优模型。采用沙普利加性解释法(SHAP)分析解释神经网络模型,DALEXtra软件包解释连续变量。结果选择神经网络模型作为最终模型。连续变量按重要程度由高至低分别为性别、导管直径、导管尖端确认方式、导管长度、患者类型、中心静脉导管植入史、皮下隧道长度、年龄、体质量指数(BMI)、原发性尖端移位、静脉左右侧入路。学习曲线[训练集受试者工作特征曲线下面积(AUC)>0.6]以及Delong试验、Bootstrap法测试显示,神经网络模型性能良好(P<0.05)。Kolmogorov-Smirnov(KS)值为0.3135,显示模型区分度良好。临床影响曲线(clinical impact curve,CIC)评估表明,模型有良好的临床价值。结论成功构建预测UAP并发CRT的机器学习模型。建议首选直径5 F导管,优选左侧静脉入路并通过解剖学测量定位导管尖端,导管长度不低于36.56 cm,皮下隧道长度不低于5 cm,以降低CRT风险。基础特征为年龄50~65岁、BMI 18.69~20.81 kg/m^(2)和23.68~23.94 kg/m^(2)、男性,与较高CRT相关。 展开更多
关键词 上臂输液港 导管相关血栓形成 机器学习 预测模型
在线阅读 下载PDF
基于机器学习的富硒土壤预测模型的构建与比较——以江西省信丰县油山地区为例
16
作者 杨兰 王运 +4 位作者 邹勇军 胡宝群 李满根 张安 朱满怀 《吉林大学学报(地球科学版)》 北大核心 2025年第5期1629-1643,共15页
利用未知硒数据快速、高效、精准地圈定富硒土壤,需构建预测富硒土壤的最佳模型。从1 277个1∶5万表层土壤的地球化学数据中选取502个数据组成数据集,以w(Zn)、w(K_(2)O)、w(P)、w(Mo)、w(Mn)、w(Cr)、pH、D(泥盆系)为自变量,以是否富S... 利用未知硒数据快速、高效、精准地圈定富硒土壤,需构建预测富硒土壤的最佳模型。从1 277个1∶5万表层土壤的地球化学数据中选取502个数据组成数据集,以w(Zn)、w(K_(2)O)、w(P)、w(Mo)、w(Mn)、w(Cr)、pH、D(泥盆系)为自变量,以是否富Se为因变量,运用SPSS Modeler 18软件构建二元Logistic回归模型、多层感知器神经网络模型、随机森林模型及支持向量机模型(包括线性、多项式、径向基和Sigmoid核函数),并通过35组土壤样品实测数据进行验证。结果表明:二元Logistic回归模型、多层感知器神经网络模型、随机森林模型及(线性、多项式、径向基、Sigmoid)支持向量机模型的预测准确率和验证总体准确率分别为88.8%和94.3%、91.0%和97.1%、96.6%和97.1%、87.9%和97.1%、86.1%和94.3%、86.9%和94.3%、80.3%和91.4%;以上模型的曲线下面积(AUC)值分别为0.948、0.950、0.993、0.937、0.945、0.928和0.873,随机森林模型的准确率和稳定性最佳。同时,本次研究发现了清洁富硒土壤及绿色富硒山稻,表明该方法在富硒土壤预测中具有可行性,且可进一步拓展到地质找矿及环境监测等领域。 展开更多
关键词 富硒土壤 机器学习 二元Logistic回归模型 多层感知器神经网络模型 随机森林模型 支持向量机模型
在线阅读 下载PDF
结合多组学和机器学习构建多发性骨髓瘤疗效预测模型
17
作者 周雄辉 桂嵘 +1 位作者 刘竞 高萌 《中南大学学报(医学版)》 北大核心 2025年第4期531-544,共14页
目的:多发性骨髓瘤(multiple myeloma,MM)是浆细胞恶性克隆性增殖的血液系统肿瘤,目前无法治愈,其中原发难治性多发性骨髓瘤(primary refractory multiple myeloma,PRMM)患者对初次诱导治疗的疗效较差。本研究旨在构建预测新诊断多发性... 目的:多发性骨髓瘤(multiple myeloma,MM)是浆细胞恶性克隆性增殖的血液系统肿瘤,目前无法治愈,其中原发难治性多发性骨髓瘤(primary refractory multiple myeloma,PRMM)患者对初次诱导治疗的疗效较差。本研究旨在构建预测新诊断多发性骨髓瘤(newly diagnosed multiple myeloma,NDMM)患者疗效的机器学习模型,推动MM患者的治疗。方法:收集2022年8月至2023年7月在中南大学湘雅三医院血液内科住院的NDMM患者和治疗后MM患者,治疗后MM患者按疗效分为PRMM患者和治疗有效MM患者(treatment response multiple myeloma,TRMM)。采用代谢组学检测其血清代谢物。基于代谢组学分析结果,结合数据库的NDMM患者转录组测序数据,筛选NDMM患者治疗后不同疗效患者间差异表达的氨基酸代谢相关基因(amino acid metabolism-related genes,AAMGs)。利用生信分析和机器学习算法,构建预测NDMM患者疗效的模型,用于筛选PRMM患者。结果:共收集61例患者,其中22例NDMM患者、23例TRMM患者和16例PRMM患者。3组患者体内代谢物水平存在差异,差异代谢物主要富集在氨基酸代谢通路。22例NDMM患者中追踪到16例的治疗效果,其中12例为初诊的TRMM患者(ND_TR组),4例为初诊的PRMM患者(newly diagnosed_primary refractory,ND_PR组),2组筛选出23个差异代谢物,在ND_PR组中,色氨酸等6个代谢物上调,柠檬酸等17个代谢物下调。最后基于数据库中TRMM(108例)和PRMM(77例)患者的测序数据获取不同疗效患者间差异表达的AAMGs,构建了疗效预测模型。模型曲线下面积(area under the curve,AUC)>0.8,3个外部验证队列AUC>0.7。结论:本研究描述了不同疗效MM患者间体内代谢物水平的变化,揭示氨基酸代谢失调可能与PRMM患者诱导治疗后疗效欠佳相关,同时结合代谢组学和转录组学,利用机器学习算法成功构建了NDMM患者的疗效预测模型。 展开更多
关键词 多发性骨髓瘤 代谢组学 转录组学 机器学习 预测模型
在线阅读 下载PDF
基于机器学习的糖尿病足发病风险预测模型构建
18
作者 楼佳烨 王艳梅 +2 位作者 潘欣欣 张志英 王红岩 《护理学杂志》 北大核心 2025年第9期26-30,共5页
目的采用5种机器学习算法构建2型糖尿病患者糖尿病足发病风险预测模型,筛选最优预测模型,为早期精准识别糖尿病足高危人群提供依据。方法通过文献回顾和专家咨询拟定糖尿病足发病风险因素调查表。2018年3月至2021年10月选取住院且接受... 目的采用5种机器学习算法构建2型糖尿病患者糖尿病足发病风险预测模型,筛选最优预测模型,为早期精准识别糖尿病足高危人群提供依据。方法通过文献回顾和专家咨询拟定糖尿病足发病风险因素调查表。2018年3月至2021年10月选取住院且接受随访管理的984例2型糖尿病患者作为研究对象,收集患者资料,采用Lasso回归法筛选预测变量,按8∶2的比例随机划分训练集787例和验证集197例。训练集采用logistic回归、决策树、支持向量机、随机森林和极端梯度提升构建模型,验证集进行内部验证,评估模型的预测性能。综合评估ROC曲线下面积和F1分数确定最优模型。基于最优模型构建并验证2型糖尿病患者糖尿病足发病风险评分表。结果有217例(22.05%)2型糖尿病患者发生糖尿病足。Lasso回归筛选出8个预测变量,包括年龄、总胆固醇、吸烟、针刺痛觉、足部皮肤湿冷、足部畸形、趾甲畸形和鞋袜不适。结果显示随机森林ROC曲线下面积为0.787,准确率为0.838,精确率为0.591,灵敏度为0.361,特异度为0.944,F1分数为0.448,较其他模型有较好的预测性能。基于随机森林模型构建的2型糖尿病患者糖尿病足发病风险评分表得分为0~101分,最佳截断值为43分,ROC曲线下面积为0.745。结论基于随机森林算法构建的模型整体预测性能最优,基于此模型构建的2型糖尿病患者糖尿病足发病风险评分表能够用于糖尿病足高风险人群的早期筛查。 展开更多
关键词 2型糖尿病 糖尿病足 风险因素 预测模型 机器学习 决策树 随机森林算法 护理
在线阅读 下载PDF
基于机器学习的冠心病风险预测模型构建与比较 被引量:2
19
作者 岳海涛 何婵婵 +3 位作者 成羽攸 张森诚 吴悠 马晶 《中国全科医学》 CAS 北大核心 2025年第4期499-509,共11页
背景冠状动脉粥样硬化性心脏病(以下简称冠心病)是全球重要的死亡原因之一。目前关于冠心病风险评估的研究在逐年增长。然而,在这些研究中常忽略了数据不平衡的问题,而解决该问题对于提高分类算法中识别冠心病风险的准确性至关重要。目... 背景冠状动脉粥样硬化性心脏病(以下简称冠心病)是全球重要的死亡原因之一。目前关于冠心病风险评估的研究在逐年增长。然而,在这些研究中常忽略了数据不平衡的问题,而解决该问题对于提高分类算法中识别冠心病风险的准确性至关重要。目的探索冠心病的影响因素,通过使用2种平衡数据的方法,基于5种算法建立冠心病风险相关的预测模型,比较这5种模型对冠心病风险的预测价值。方法基于2021年美国国家行为风险因素监测系统(BRFSS)横断面调查数据筛选出112606名研究对象的健康相关风险行为、慢性健康状况等24个变量信息,结局指标为自我报告是否患有冠心病并据此分为冠心病组和非冠心病组。通过进行单因素分析和逐步Logistic回归分析探索冠心病发生的影响因素并筛选出纳入预测模型的变量。随机抽取112606名受访者的10%(共计11261名),以8∶2的比例随机划分为训练与测试的数据集,采用随机过采样和合成少数过采样技术(SMOTE)两种过采样的方法处理不平衡数据,基于k最邻近算法(KNN)、Logistic回归、支持向量机(SVM)、决策树和XGBoost算法分别建立冠心病预测模型。结果两组年龄、性别、BMI、种族、婚姻状态、教育水平、收入水平、家里有几个孩子、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者、过去30 d内是否有体育锻炼、心理健康状况以及自我健康评价比较,差异有统计学意义(P<0.05)。逐步Logistic回归分析结果显示:年龄、性别、BMI、种族、教育水平、收入水平、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者以及自我健康评价为冠心病的影响因素(P<0.05)。风险模型构建的分析结果显示:k最邻近算法、Logistic回归、支持向量机、决策树和XGBoost采用SMOTE处理不平衡数据的总体分类精度分别为59.2%、67.4%、66.2%、69.2%和85.9%,召回率分别为75.2%、71.4%、70.5%、62.9%和34.8%,精确度分别为15.4%、18.2%、17.5%、17.6%和28.7%,F值分别为0.256、0.290、0.280、0.275和0.315,受试者工作特征曲线下面积分别为0.80、0.78、0.72、0.72和0.82;采用随机过采样处理不平衡数据的总体分类精度分别为62.5%、68.5%、69.0%、60.2%和70.1%,召回率分别为70.0%、69.5%、71.9%、69.0%和67.6%;精确度分别为15.8%、18.4%、19.1%、14.8%和19.0%,F值分别为0.258、0.291、0.302、0.244和0.297,受试者工作特征曲线下面积分别为0.80、0.77、0.72、0.72和0.83。结论本研究不仅确认了已知冠心病的影响因素,还发现了自我健康评价水平、收入水平和教育水平对冠心病具有潜在影响。在使用2种数据平衡方法后,5种算法的性能显著提高。其中XGBoost模型表现最佳,可作为未来优化冠心病预测模型的参考。此外,鉴于XGBoost模型的优异性能以及逐步Logistic回归的操作便捷和可解释性,推荐在冠心病风险预测模型中结合使用数据平衡后的XGBoost和逐步Logistic回归分析。 展开更多
关键词 冠心病 机器学习 风险预测模型 LOGISTIC回归 k最邻近算法 支持向量机 决策树 XGBoost
在线阅读 下载PDF
缺血性脑卒中后吞咽障碍的危险因素分析及机器学习预测模型的构建
20
作者 叶枫 郭莹 +2 位作者 程良玲 陈玲 范晓芳 《医学研究与战创伤救治》 北大核心 2025年第5期523-528,共6页
目的构建基于临床特征预测缺血性脑卒中后吞咽障碍的机器学习模型,并分析重要危险因素。方法回顾性分析2022年12月至2024年6月住院治疗的缺血性脑卒中患者,将患者按照7∶3的比例随机分为训练集和验证集,根据洼田饮水试验将患者分为吞咽... 目的构建基于临床特征预测缺血性脑卒中后吞咽障碍的机器学习模型,并分析重要危险因素。方法回顾性分析2022年12月至2024年6月住院治疗的缺血性脑卒中患者,将患者按照7∶3的比例随机分为训练集和验证集,根据洼田饮水试验将患者分为吞咽障碍组和非吞咽障碍组,进行单因素和多因素Logistic回归筛选出缺血性脑卒中患者发生吞咽障碍的独立危险因素,并基于K-最近邻(KNN)、决策树(DT)、随机森林(RF)、支持向量机(SVM)、轻量梯度提升(LGBM)和极端梯度提升(XGBoost)6种机器学习模型构建缺血性脑卒中后吞咽障碍的预测模型。绘制受试者工作特征(ROC)曲线,计算曲线下面积(AUC),采用DeLong检验比较6种模型的AUC,最终获得最优模型,并通过该模型对筛选出的临床特征进行分析。结果共纳入302例缺血性脑卒中患者,其中吞咽障碍187例,非吞咽障碍115例。单因素和多因素Logistic回归分析结果提示NIHSS评分、年龄,肌力减弱、咳嗽和构音障碍是吞咽障碍发生的独立危险因素。ROC曲线分析显示,在训练集中,KNN、DT、RF、SVM、LGBM以及XGBoost的AUC分别为0.989、0.890、0.995、0.905、0.500、0.922,RF的AUC高于其他五种模型,但其中RF和KNN两者之间不具有统计学差异。在验证集中,KNN、DT、RF、SVM、LGBM以及XGBoost的AUC分别为0.857、0.865、0.917、0.887、0.500以及0.914,RF的AUC虽高于KNN和DT模型,但两者之间不具有统计学差异。在所有的预测变量中,使用RF模型筛选出影响吞咽障碍最重要的预测变量依次为年龄、NIHSS评分、构音障碍、咳嗽以及肌力减弱。结论机器学习模型可作为预测脑卒中后吞咽障碍的可靠工具,RF模型具有最佳的预测性能,影响吞咽障碍最重要的预测变量依次为年龄、NIHSS评分、构音障碍、咳嗽以及肌力减弱,可在一定程度上帮助临床医师对吞咽障碍患者进行早期识别和干预。 展开更多
关键词 脑卒中 吞咽障碍 机器学习 预测模型
在线阅读 下载PDF
上一页 1 2 70 下一页 到第
使用帮助 返回顶部