期刊文献+
共找到1,412篇文章
< 1 2 71 >
每页显示 20 50 100
磁共振高分辨率延迟期的可解释性机器学习模型术前预测浸润性乳腺癌组织学分级 被引量:1
1
作者 匡静 黄松涛 +1 位作者 黄小华 胡云涛 《磁共振成像》 北大核心 2025年第5期164-169,216,共7页
目的探讨基于磁共振高分辨率增强延迟期图像的夏普利加性解释(Shapley additive explanations,SHAP)机器学习模型术前预测非特殊型浸润性乳腺癌组织分级的价值。材料与方法回顾性收集2019年1月至2023年12月154例非特殊型浸润性乳腺癌患... 目的探讨基于磁共振高分辨率增强延迟期图像的夏普利加性解释(Shapley additive explanations,SHAP)机器学习模型术前预测非特殊型浸润性乳腺癌组织分级的价值。材料与方法回顾性收集2019年1月至2023年12月154例非特殊型浸润性乳腺癌患者的临床-病理-影像学资料,根据病理活检结果将Ⅰ级、Ⅱ级纳入低级别组和Ⅲ级纳入高级别组。按7∶3比例随机分为训练组(n=107)和验证组(n=47)。利用3D slicer勾画病灶边缘并提取影像组学特征。通过多因素分析筛选影像组学特征。通过随机森林(random forest,RF)、logistic回归建立影像组学特征模型,采用logistic回归建立临床模型、影像学模型,以及影像学-临床-影像组学特征联合模型。采用受试者工作特征(receiver operating characteristic,ROC)曲线下面积AUC(area under the curve,AUC)、准确率评估模型的效能,模型比较采用DeLong检验。通过SHAP分析可视化特征在模型中的贡献度和重要性。结果孕激素受体(progesterone receptor,PR)、肿瘤边界、细胞增殖因子(Ki-67)、雌激素受体(estrogen receptor,ER)在低级别组和高级别组之间差异有统计学意义(P<0.05)。基于影像学-临床-影像组学特征的联合模型术前预测浸润性乳腺癌组织分级的AUC值最高,在训练组和验证组的AUC分别为0.807(95%CI:0.723~0.891)、0.890(95%CI:0.795~0.984)。两种独立的影像组学特征模型中,logistic影像组学模型无明显过拟合,在训练组和验证组的AUC分别为0.750(95%CI:0.655~0.846)、0.801(95%CI:0.667~0.936)。临床模型、影像学模型在训练组的AUC分别为0.661(95%CI:0.551~0.771),0.600(95%CI:0.493~0.706),在验证组的AUC分别为0.789(95%CI:0.645~0.933),0.708(95%CI:0.565~0.850)。结论联合模型术前预测非特殊型浸润性乳腺癌分级的效能较好,可为临床术前治疗乳腺癌提供一定指导。 展开更多
关键词 磁共振成像 可解释性机器学习 高分辨率延迟期成像 浸润性乳腺癌 分级
在线阅读 下载PDF
缺资料地区可解释性混合机器学习模型中长期径流预报
2
作者 由宇军 白云岗 +4 位作者 卢震林 张江辉 曹彪 李文忠 余其鹰 《长江科学院院报》 北大核心 2025年第7期52-59,共8页
在无资料地区气象、水文等观测资料缺乏,影响径流预报的准确性,直接影响水文预报和防汛抗旱工作的开展。分析无资料地区现有的降水、气温和径流数据在中长期预报中的适用性,进而实现径流预报非常重要。分别采用卷积神经网络算法(CNN)、... 在无资料地区气象、水文等观测资料缺乏,影响径流预报的准确性,直接影响水文预报和防汛抗旱工作的开展。分析无资料地区现有的降水、气温和径流数据在中长期预报中的适用性,进而实现径流预报非常重要。分别采用卷积神经网络算法(CNN)、双向门控循环神经网络(BiGRU)、注意力机制(Attention)和优化粒子群算法(IPSO)构建CNN-BiGRU-Attention、IPSO-CNN-BiGRU-Attention组合模型,再与门控循环单元模型(GRU)和ABCD水量平衡模型进行对比分析,并在玉龙喀什河进行综合评估,并结合SHAP可解释性机器学习方法探究最优模型中输入特征对径流影响的贡献程度。结果表明:加入降水和气温的组合模型IPSO-CNN-BiGRU-Attention预测精度整体优于CNN-BiGRU-Attention、GRU模型,与实际值能够较好地吻合;随着预见期的增加,提出的组合模型在验证期内均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分误差(MAPE)、纳什效率系数(NSE)分别为2.11、1.32 m^(3)/s、73.76%和0.94,并且在前3个月预报精度最高。该方法在缺资料地区月径流预报中具有较好的效果。 展开更多
关键词 径流预报 缺资料地区 SHAP可解释性机器学习方法 组合模型IPSO-CNN-BiGRU-Attention 预测精度
在线阅读 下载PDF
基于可解释机器学习的混凝土重力坝变形安全监控模型 被引量:2
3
作者 程琳 袁喜娜 +2 位作者 马春辉 贾冬焱 徐笑颜 《水利水电科技进展》 北大核心 2025年第3期77-85,共9页
针对目前基于机器学习的大坝安全监控模型无法给出模型预测解释的问题,引入SHAP值理论,并结合LightGBM模型,建立了一种具备可解释性的混凝土重力坝变形安全监控模型,且该模型可以量化每个影响因子的具体贡献。工程实例验证结果表明,该... 针对目前基于机器学习的大坝安全监控模型无法给出模型预测解释的问题,引入SHAP值理论,并结合LightGBM模型,建立了一种具备可解释性的混凝土重力坝变形安全监控模型,且该模型可以量化每个影响因子的具体贡献。工程实例验证结果表明,该模型考虑了变形与环境量之间复杂的非线性关系,更接近真实情况,不仅具有良好的拟合精度和预测精度,还能对模型进行全局和局部的解释。 展开更多
关键词 混凝土重力坝 变形安全监控 解释机器学习 SHAP值理论 LightGBM模型
在线阅读 下载PDF
测井智能解释中机理模型—机器学习联合驱动范式及应用
4
作者 谭茂金 白洋 张博栋 《石油地球物理勘探》 北大核心 2025年第4期966-977,共12页
地球物理测井是探测地下油气储层流体类型和评价储层参数的重要手段,传统测井解释方法面临挑战。人工智能(AI)算法先进,精度高,在测井解释方面具有独特的优势,“测井+AI”是当前测井解释研究的新领域。然而,智能测井解释中,样本规模小... 地球物理测井是探测地下油气储层流体类型和评价储层参数的重要手段,传统测井解释方法面临挑战。人工智能(AI)算法先进,精度高,在测井解释方面具有独特的优势,“测井+AI”是当前测井解释研究的新领域。然而,智能测井解释中,样本规模小、训练模型泛化能力弱导致单纯机器学习的测井解释方法难以推广应用。物理模型包含从测井数据到地质目标的内在机理,将数据驱动与机理驱动相结合是提高测井解释精度的有效途径。现有的数据—机理联合驱动缺乏范式遵循,为此,聚焦智能测井解释参数预测,提出了数据—机理联合驱动的概念、思路,并总结出两个范式:一是数据引导的物理建模,以物理建模为主导,其中关键步骤或参数采用数据驱动获得,数据驱动为辅;二是物理引导的机器学习,以机器学习为主导,知识模型或物理机理为辅助,对输入数据、损失函数、训练过程进行监督和约束。因此,提出了物理模型增广数据集、知识驱动样本加权和岩石物理知识迁移三种数模双驱模式。将上述数模双驱的范式或模式应用于致密砂岩、有机页岩储层参数预测和矿物含量预测。与单纯数据驱动的机器学习相比,数据—机理联合的双轮驱动范式能够显著提高测井解释模型对小样本、差样本的学习能力,模型的稳健性更好,泛化能力更强,解释精度更高。 展开更多
关键词 测井解释 机理模型 机器学习 联合驱动 储层智能评价
在线阅读 下载PDF
基于可解释性机器学习的芬顿工艺降解有机污染物速率的研究
5
作者 于林堂 陈咚咚 +1 位作者 陶翠翠 朱腾义 《中国环境科学》 北大核心 2025年第8期4294-4302,共9页
采用机器学习模型,包括多元线性回归(MLR)和轻量级梯度提升机(LGB)算法,预测芬顿工艺中57种有机污染物的降解效率.通过SHAP方法对模型进行机理解释,识别了影响降解效率的关键因素.研究结果表明,LGB模型在预测精度上(R_(adj)^(2)=0.969, ... 采用机器学习模型,包括多元线性回归(MLR)和轻量级梯度提升机(LGB)算法,预测芬顿工艺中57种有机污染物的降解效率.通过SHAP方法对模型进行机理解释,识别了影响降解效率的关键因素.研究结果表明,LGB模型在预测精度上(R_(adj)^(2)=0.969, Q^(LOO)^(2)=0.925, R_(ext)^(2)=0.844)优于MLR模型(R_(adj)^(2)=0.831, Q_(LOO)^(2)=0.802, R_(ext)^(2)=0.861).SHAP分析揭示了温度、分子三维结构和原子电离能力是影响降解效率的主要因素.本研究为优化芬顿工艺的操作条件和提升降解效率提供了科学依据,对水处理领域的研究和实践具有重要的指导意义. 展开更多
关键词 芬顿氧化工艺 污染物降解速率常数log K 有机污染物 机器学习模型 SHAP分析
在线阅读 下载PDF
利用可解释机器学习模型判别豫西巩义市康店镇黄土地质灾害易发性 被引量:2
6
作者 包峻帆 陈婕 +10 位作者 杨文涛 杨泽强 侯文青 陈恪 袁野 杨明权 景斐媛 刘淼昕 刘哲 张媛媛 黄灿 《科学技术与工程》 北大核心 2025年第15期6200-6219,共20页
黄土丘陵区是地质灾害高发频发的地区之一,亟需采用合适的评价因子和训练模型开展地质灾害易发性评价研究。以郑州“7·20”特大暴雨期间受灾最严重的乡镇巩义市康店镇为研究区,基于卫星遥感解译、实地调查、无人机航拍及相关资料收... 黄土丘陵区是地质灾害高发频发的地区之一,亟需采用合适的评价因子和训练模型开展地质灾害易发性评价研究。以郑州“7·20”特大暴雨期间受灾最严重的乡镇巩义市康店镇为研究区,基于卫星遥感解译、实地调查、无人机航拍及相关资料收集,构建覆盖黄土界面、人类工程活动、水动力作用3个主控因素13个影响因子的评价体系,采用CatBoost模型、XGBoost模型和LightGBM模型共3种机器学习算法,开展地质灾害易发性评价研究,基于性能最优的机器学习模型,运用SHAP(shapley additive explanations)算法完成特征全局解释与依赖性分析。结果表明:CatBoost模型的精度高于其他模型(XGBoost和LightGBM),在AUC(area under curve)值、SHAP准确度、精确率、召回率、F_(1)分数和野外验证中均表现最优,其极高、高、中、低、极低易发区域面积占比分别为3.19%、1.40%、2.04%、5.93%、87.44%,极高、高易发区域主要分布在人类活动强烈的冲沟两侧,切坡建房是地质灾害发生的重要诱因。本次研究旨在优化建模思路,对建模过程的不确定性和可解释性进行研究,对机器学习的易发性决策机理进行解释分析,为豫西黄土丘陵区地质灾害防治提供科学依据。 展开更多
关键词 黄土丘陵区 地质灾害易发性 机器学习模型 SHAP 模型解释
在线阅读 下载PDF
基于机器学习和SHAP算法的声波测井曲线重构及可解释性分析 被引量:6
7
作者 黎子豪 蒋恕 《地质科技通报》 北大核心 2025年第1期321-331,共11页
测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间... 测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间的关系模型使得曲线重构精度相对较低,机器学习算法虽能在大量数据之间找到最为合适的数据映射关系进而提高模型精度,但相较而言其所构建的黑箱模型无法得到良好的解释。近期,可解释性算法的运用使得机器学习在重构测井曲线中的应用更为合理。通过将支持向量回归(support vector regression,简称SVR),随机森林(random forest,简称RF)以及极限梯度提升(extreme gradient boosting,简称XGBoost)和传统多元线性回归方法(linear regression,简称LR)的对比对英国能源局22-30b-11号井声波测井曲线进行了模型重构并基于shapley additive explanations(SHAP)算法对XGBoost模型进行了解释。结果表明,XGBoost在测试集上的决定系数(R2)和均方误差(MSE)分别为0.996,6.371,优于SVR的0.990、15.755和RF的0.993、9.871,而传统多元线性回归方法则为0.969、48.895,表明XGBoost对声波时差曲线的重构具有更高的准确度和更好的泛化性能。创新性地采用SHAP算法对XGBoost黑箱模型的解释表明,在模型构建选择重要特征时,XGBoost模型采用地层温度数据作为特征明显合理于多元线性回归方法采用的井径测井数据。最后基于SHAP对模型进行了单点和全局特征交互解释。上述结果表明在声波测井曲线重构方面,机器学习算法明显优于传统的多元线性回归方法,并证明了SHAP算法在声波测井曲线重构机器学习模型解释方面的可行性,为后续机器学习在测井解释中的发展提供了新的思路。 展开更多
关键词 测井曲线重构 机器学习 模型解释 SHAP算法 声波测井
在线阅读 下载PDF
基于可解释机器学习方法老年脑卒中患者吞咽障碍预测模型的构建与验证
8
作者 刘韵涵 姜明明 +5 位作者 李冬梅 丁瑜 解恒革 何昆仑 周武红 程艳爽 《中华老年心脑血管病杂志》 北大核心 2025年第6期698-704,共7页
目的 基于老年脑卒中患者临床及实验室指标,利用可解释机器学习方法构建并验证卒中后吞咽障碍(post-stroke dysphagia, PSD)风险预测模型。方法 回顾性选取2010年10月至2021年12月解放军总医院第一医学中心神经内科收治的含有完整吞咽... 目的 基于老年脑卒中患者临床及实验室指标,利用可解释机器学习方法构建并验证卒中后吞咽障碍(post-stroke dysphagia, PSD)风险预测模型。方法 回顾性选取2010年10月至2021年12月解放军总医院第一医学中心神经内科收治的含有完整吞咽功能表述的老年脑卒中患者3994例,将2019年1月至2021年12月的1390例患者作为外部验证集,2010年10月至2019年1月的2604例作为训练组。将训练组按照7:3随机分为训练集1823例和内部验证集781例,根据是否发生PSD将训练组患者分为PSD组773例和非PSD组1831例。以PSD发生为终点事件,构建随机森林(random forest, RF)、极端梯度提升(eXtreme Gradient Boosting, XGBoost)、支持向量机(Support Vector Machine, SVM)和logistic回归模型,通过ROC曲线评估模型性能。优选最佳模型后,采用夏普利加性解释(SHapley Additive exPlanations, SHAP)方法量化特征。结果 PSD组肌力等级、脑卒中侧、脑损伤区域与非PSD组比较,差异有统计学意义(P<0.01),PSD组高血压、糖尿病、饮酒史、中性粒细胞水平明显高于非PSD组,血钾、血清白蛋白水平明显低于非PSD组(P<0.05,P<0.01)。多因素logistic回归分析显示,年龄、饮酒史、糖尿病、高血压、肌力等级、脑损伤区域、脑卒中侧、中性粒细胞、血清白蛋白、血钾是PSD的危险因素(P<0.05,P<0.01)。在外部验证中,RF、XGBoost、SVM、logistic回归模型验证集的曲线下面积分别为0.883、0.902、0.877、0.868。SHAP值分布显示,饮酒史、高血压、糖尿病与PSD风险呈正相关;肌力等级与风险呈负相关;年龄增长与PSD风险呈正相关;幕下损伤比幕上或全区域损伤的预测作用更强;双侧和右侧损伤较左侧损伤的PSD风险更高。结论 基于XGBoost模型构建的老年患者PSD风险预测模型性能最优。 展开更多
关键词 卒中 吞咽障碍 预测 LOGISTIC模型 算法 机器学习
在线阅读 下载PDF
应用SHAP可解释机器学习模型估测森林蓄积量
9
作者 王元 王玥 +3 位作者 周宇琛 陈伏生 张绿水 刘牧 《东北林业大学学报》 北大核心 2025年第5期66-73,共8页
森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国... 森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国家森林资源连续清查的地面实测数据,分析不同影像特征参数在森林蓄积量反演中的贡献率。结果表明:对比多元线性回归、神经网络、随机森林和XGBoost模型估测森林蓄积量的精度,随机森林模型估测精度为93.3%,决定系数(R^(2))为0.9337,均方根误差为2.2323,平均绝对误为2.3395;与BP神经网络模型(R^(2)=0.8219)和XGBoost模型(R^(2)=0.7916)相比,模型拟合度和预测效果更佳,比多元线性回归模型(R^(2)=0.688)处理非线性关系的稳定性和可靠性更高。通过解释特征参数的相对重要性,揭示出平均胸径、郁闭度等特征对森林蓄积量影响显著,且随机森林模型中各因子间存在相互作用。 展开更多
关键词 SHAP解释模型 机器学习模型 森林蓄积量
在线阅读 下载PDF
基于可解释性机器学习算法的珠江河口区咸潮上溯预报
10
作者 祝雨珂 易晶晶 +1 位作者 刘培霖 刘丙军 《水电能源科学》 北大核心 2025年第10期18-22,共5页
为有效应对珠江河口区咸潮上溯日趋加重的问题,利用磨刀门水道逐时观测数据,基于梯度提升决策树(GBDT)、极端梯度提升(XGBoost)、轻量级梯度提升(Light GBM)、类别提升(Cat Boost)模型框架,结合可解释性的SHAP模型进行咸潮上溯逐时预报... 为有效应对珠江河口区咸潮上溯日趋加重的问题,利用磨刀门水道逐时观测数据,基于梯度提升决策树(GBDT)、极端梯度提升(XGBoost)、轻量级梯度提升(Light GBM)、类别提升(Cat Boost)模型框架,结合可解释性的SHAP模型进行咸潮上溯逐时预报。结果表明,4种机器学习算法模型均具有较好的预报效果,其中Cat Boost模型表现最好,24 h预见期模型纳什效率系数为0.738 5;基于SHAP模型特征重要性排序进一步优选输入因子,可以提高模型精度,优化后的Cat Boost模型纳什效率系数、相关系数分别提升了0.30%、0.13%;对咸潮上溯预报不同特征进行SHAP分析可提高模型可解释性,分析发现盐度特征对咸潮上溯预报呈线性正相关影响,单一特征的SHAP分布图散点的分布越集中,特征重要性越大。 展开更多
关键词 咸潮上溯预报 SHAP模型 机器学习 珠江河口
在线阅读 下载PDF
基于可解释机器学习模型的基坑围护墙变形影响因素分析
11
作者 刘亚栋 刘贤 +2 位作者 胡贺松 陈航 乔升访 《中国安全科学学报》 北大核心 2025年第4期110-119,共10页
为了提高基坑变形预测的可解释性,构建一种基于可解释机器学习的基坑围护墙变形预测模型,并详细分析各特征变量对预测结果的影响。首先,将大量的基坑支护结构参数作为数据集,利用80%的数据集和极限梯度提升(XGBoost)模型构建基坑围护墙... 为了提高基坑变形预测的可解释性,构建一种基于可解释机器学习的基坑围护墙变形预测模型,并详细分析各特征变量对预测结果的影响。首先,将大量的基坑支护结构参数作为数据集,利用80%的数据集和极限梯度提升(XGBoost)模型构建基坑围护墙最大侧移的预测模型;然后,基于20%的数据集对模型进行测试,利用决定系数、偏差系数、平均绝对百分差和均方根误差4种指标评估模型精度;最后,基于XGBoost模型,运用沙普利加和解释(SHAP)方法完成基坑特征变量的全局解释、单个样本的局部分析和特征变量的交互作用分析。结果表明:所提方法能够对基坑的变形预测进行全局和局部解释。在全局层面,不仅能提供基坑特征变量的重要性排序,还可以给出SHAP值的分布;在局部层面,能够将单个样本的变形预测结果分解为基值和每个特征变量的贡献,从而量化单个特征变量的影响。 展开更多
关键词 可解释性 机器学习模型 基坑 围护墙变形 影响因素 特征变量
在线阅读 下载PDF
使用开源代码训练大模型的著作权法评价——以全球首例机器学习诉讼为研究样本 被引量:2
12
作者 张韬略 《知识产权》 北大核心 2025年第3期47-70,共24页
从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源... 从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源信息的行为,但训练数据集不公开在多方面限制了著作权侵权认定。司法机关以大模型输出端为规制对象并以合理使用为利益调节器的务实思路,向大模型产业传递了友好信号,刺激了降重技术的开发,并可能进一步降低著作权人提起侵权诉讼的概率和理论正当性。个案分析过程还暴露出我国著作权法在应对大模型训练著作权侵权问题时的优缺点。我国亟需修正合理使用制度以应对大模型开发对数据训练的需求,同时应从立法和技术角度推动训练数据著作权权属信息的透明化,以保护作者著作人身权和电子权利管理信息。 展开更多
关键词 开源代码 模型 机器学习 著作权侵权 合理使用
在线阅读 下载PDF
数字经济何以赋能新质生产力:基于生产关系理论与双重机器学习模型 被引量:2
13
作者 吴小军 《暨南学报(哲学社会科学版)》 北大核心 2025年第4期29-44,共16页
数字经济作为推动城市高质量发展的新引擎,在提升新质生产力和实现可持续发展方面具有重要意义。立足生产关系视角,选取2011-2022年282个地级市面板数据,基于双重机器学习模型探究数字经济对新质生产力的作用机制。研究发现,数字经济能... 数字经济作为推动城市高质量发展的新引擎,在提升新质生产力和实现可持续发展方面具有重要意义。立足生产关系视角,选取2011-2022年282个地级市面板数据,基于双重机器学习模型探究数字经济对新质生产力的作用机制。研究发现,数字经济能有效赋能城市新质生产力发展,且数字经济对新质劳动对象的影响最大。就区域而言,数字经济对新质生产力的影响程度从大到小依次为东部地区、西部地区、中部地区、东北地区,与经济发展水平低的城市相比,经济发展水平高的城市数字经济对新质生产力的促进作用更大,且在不同资源禀赋下数字经济对新质生产力的影响程度从大到小依次为再生型城市、成长型城市、衰退型城市、非资源型城市、成熟型城市。机制检验结果表明,数字经济能够通过要素配置优化、产业结构转型等机制驱动新质生产力水平的提升。 展开更多
关键词 数字经济 双重机器学习模型 新质生产力 生产关系
在线阅读 下载PDF
融合物理机制的机器学习水文模型研究进展
14
作者 张建云 谢康 +3 位作者 刘艳丽 郑雅莲 汤梓杰 王国庆 《人民长江》 北大核心 2025年第10期37-46,共10页
随着信息技术和物理模型的发展,融合物理机制的机器学习方法因其优越的准确性、物理一致性以及有效处理不确定性和非线性特征的能力,正逐渐成为水文领域的研究热点。在重点综述近10 a来融合物理机制的机器学习在水文模型中最新应用与发... 随着信息技术和物理模型的发展,融合物理机制的机器学习方法因其优越的准确性、物理一致性以及有效处理不确定性和非线性特征的能力,正逐渐成为水文领域的研究热点。在重点综述近10 a来融合物理机制的机器学习在水文模型中最新应用与发展的基础上,总结了物理机制与机器学习融合模型的不同应用分类,分为误差校正型、参数优化型、数据增强型、物理约束型、结构内嵌型、公式融入型等6种,并重点讨论了数据与物理双驱动水文模型的进展与不足。最后,展望了融合物理机制的机器学习在水文模型中的发展方向,提出需重点关注模型参数优化、可解释性问题、小样本及中长期尺度模拟等方面的研究,让物理机制与人工智能深度结合的新方法促进水文模型领域的建设与发展。 展开更多
关键词 水文模型 数据驱动 物理机制 机器学习
在线阅读 下载PDF
基于机器学习的巷道围岩变形融合分析及预测模型
15
作者 王猛 袁春玉 +4 位作者 李鑫磊 胡超 袁瑞甫 尚栋煌 王成 《采矿与岩层控制工程学报》 北大核心 2025年第4期75-91,共17页
为解决巷道变形预测和破坏区定位困难等问题,建立了多重扰动底抽巷围岩数值分析模型,选取围岩强度、侧压系数等地质参数,巷道断面尺寸、抽采钻孔、支护强度等开采参数作为研究对象,获取了多因素扰动下底抽巷顶板变形数据集,采用随机森... 为解决巷道变形预测和破坏区定位困难等问题,建立了多重扰动底抽巷围岩数值分析模型,选取围岩强度、侧压系数等地质参数,巷道断面尺寸、抽采钻孔、支护强度等开采参数作为研究对象,获取了多因素扰动下底抽巷顶板变形数据集,采用随机森林、极端随机树、GBDT、XGBoost等机器学习算法,分别建立了单一基学习器巷道变形预测模型,以弹性网算法为元学习器,利用Stacking融合方法,对不同基学习器输出模型进行了融合处理,构建了多重扰动底抽巷围岩变形融合预测模型,评价了各特征因素对巷道变形的抑促效应,识别了影响底抽巷围岩稳定的主控因素。以赵固二矿14040运输巷底抽巷为工程背景,利用建立的巷道变形预测模型,以巷道实际生产地质条件和开采参数作为输入项,通过设置巷道期望变形量,逆向运算并输出了试验巷道建议支护强度,并指导了现场巷道支护设计及关键参数确定。现场应用结果表明,采用建议支护强度后,巷道实测变形值处于决策模型规定的允许范围内,顶板变形量仅为原支护的52%,有效控制了巷道围岩大变形。基于机器学习建立的巷道变形预测模型为巷道稳定维护提供了一条新途径,促进了煤矿巷道智能运维技术的发展。 展开更多
关键词 巷道变形 机器学习 预测模型 智能运维 围岩控制
在线阅读 下载PDF
比较多种机器学习模型预测肺移植术后受者生存
16
作者 史灵芝 刘亚灵 +7 位作者 严浩吉 喻赠玮 侯森林 刘明昭 杨航 吴波 田东 陈静瑜 《器官移植》 北大核心 2025年第2期264-271,共8页
目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随... 目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随机生存森林(RSF)和极端梯度提升树(XGBoost)构建预后模型,使用综合曲线下面积(iAUC)和时间依赖曲线下面积(t AUC)进行模型性能评估。结果 训练集和验证集的各变量差异均无统计学意义。基于VIMP筛选排名前15的变量用于建模并确定重症监护室(ICU)住院时间为最重要的因素。与XGBoost模型相比,RSF模型在预测受者生存期方面表现出更好的性能(i AUC0.773比0.723)。在预测受者6个月生存期(tAUC6个月0.884比0.809,P=0.009)和1年生存期(tAUC1年0.896比0.825,P=0.013)方面,RSF模型也表现出更好的性能。基于两种算法的预测截断值,将LTx术后受者分为高风险组和低风险组,两种模型的生存分析结果均显示高风险组受者的生存率低于低风险组(P<0.001)。结论 与XGBoost相比,基于RSF算法开发的机器学习预后模型可以更好地预测LTx受者的生存期。 展开更多
关键词 肺移植 机器学习 预测模型 随机生存森林 极端梯度提升树 生存期 比例风险回归模型 重症监护室
在线阅读 下载PDF
基于不同机器学习方法构建非心脏手术老年患者术后谵妄预测模型
17
作者 石金云 陈荣 +2 位作者 李文媛 纪木火 李青 《临床麻醉学杂志》 北大核心 2025年第3期240-245,共6页
目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等... 目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等共102个变量。采用单因素分析初步筛选危险因素,将有统计学差异(P<0.05)的变量纳入最小绝对收缩与选择算子(LASSO)筛选特征变量,应用随机森林(RF)、支持向量机(SVM)、自适应增强算法(Adaboost)和神经网络(NN)4种机器学习方法构建POD预测模型,采用受试者工作特征曲线下面积(AUROC)、精确度-召回率(PR)曲线的平均精度(AP)、Brier评分等对模型进行综合评估,引入Shapley加性解释(SHAP)对最优机器学习模型进行可解释化分析。结果有155例(17%)患者发生POD,经LASSO回归分析后,确定10个特征变量用于构建机器学习模型。4种机器学习模型中,RF的AUROC最高为0.90(95%CI 0.86~0.93),AP为0.8,Brier评分为0.086。SHAP模型解释性分析显示,对POD贡献度最高的是手术时间。结论在应用4种机器学习方法构建的非心脏手术老年患者POD预测模型中,RF的预测效能最佳。 展开更多
关键词 非心脏外科手术 术后谵妄 机器学习 预测模型 Shapley加性解释
在线阅读 下载PDF
基于机器学习算法构建青少年特发性脊柱侧凸进展风险预测模型
18
作者 李洁 赵晓峰 +3 位作者 周润田 曾琪 陈容 赵斌 《中国脊柱脊髓杂志》 北大核心 2025年第8期837-847,共11页
目的:通过机器学习算法筛选青少年特发性脊柱侧凸(adolescent idiopathic scoliosis,AIS)进展的核心预测变量,并构建风险预测模型。方法:选取山西医科大学第二医院2018年1月~2023年6月首次确诊的361例AIS患者追踪随访。收集患者基本资... 目的:通过机器学习算法筛选青少年特发性脊柱侧凸(adolescent idiopathic scoliosis,AIS)进展的核心预测变量,并构建风险预测模型。方法:选取山西医科大学第二医院2018年1月~2023年6月首次确诊的361例AIS患者追踪随访。收集患者基本资料和影像学资料,根据侧凸进展(主弯Cobb角增长≥6°)与否将患者分为进展组与非进展组,并按8∶2随机分为训练集与测试集。采用LASSO回归和随机生存森林(random survival forest,RSF)筛选侧凸进展的预测变量,并分别构建RSF模型、生存支持向量机(survival support vector machine,SSVM)模型和极限梯度提升(extreme gradient boosting,XGBoost)模型,采用C-index和综合Brier分数比较选择最优模型。使用测试集数据,采用受试者工作特征(receiver operating characteristic,ROC)曲线和曲线下面积(area under the curve,AUC)、校正C-index、校准曲线、综合Brier分数和决策曲线分析(decision curve analysis,DCA)分别对最优模型的区分度、准确度和临床应用价值进行评价。结果:361例AIS患者的侧凸进展率为41.27%,LASSO回归分析和RSF算法筛选的共同预测因子分别是:初诊Cobb角、Risser征、顶椎旋转度、脊柱增长速率、是否支具治疗、T1椎体倾斜角和顶椎偏距。RSF模型、SSVM模型和XGBoost模型的C-index为0.837、0.790和0.743,综合Brier分数为0.084、0.161和0.133。综合模型的区分度和准确度,RSF模型表现更优,其6个月、12个月、18个月和24个月的时间依赖性AUC值分别为:0.903(95%CI:0.829~0.977)、0.870(95%CI:0.756~0.985)、0.858(95%CI:0.742~0.973)和0.862(95%CI:0.728~0.997),校正C-index为0.842(95%CI:0.749~0.917),模型区分度好。校准曲线显示实际观察结果与预测结果基本一致,综合Brier分数0.084,预测准确度高。DCA显示6个月、12个月、18个月和24个月的风险阈值概率分别在5%~20%、10%~80%、10%~70%和25%~85%时,使用本模型可使患者的净受益率增加。结论:基于初诊Cobb角、Risser征、顶椎旋转度、脊柱增长速率、是否支具治疗、T1椎体倾斜角和顶椎偏距构建的RSF模型可以较为准确地预测AIS患者首次确诊后在未来不同时间点侧凸进展的风险概率。 展开更多
关键词 青少年特发性脊柱侧凸 侧凸进展 机器学习 预测模型
在线阅读 下载PDF
通过机器学习预测模型理解荔枝开花过程
19
作者 苏钻贤 宁振辰 +1 位作者 汪情 陈厚彬 《果树学报》 北大核心 2025年第5期1045-1056,共12页
[目的]荔枝开花的早晚影响果实成熟期、成花率和产量,也影响荔枝产业的高质量发展。针对荔枝开花期预测的空白,旨在构建气象因子、植株状态与荔枝开花进程的关系模型,为实现成熟期调控提供依据。[方法]通过收集2009-2020年荔枝物候期、... [目的]荔枝开花的早晚影响果实成熟期、成花率和产量,也影响荔枝产业的高质量发展。针对荔枝开花期预测的空白,旨在构建气象因子、植株状态与荔枝开花进程的关系模型,为实现成熟期调控提供依据。[方法]通过收集2009-2020年荔枝物候期、品种、树龄和气象数据,建立物候生态特征数据集,并利用随机森林(RF)和逐步回归(STR)算法构建荔枝花穗发育和开花持续期双阶段预测模型体系,经过5倍交叉验证、999次鲁棒性测试和2 a(年)盲测数据验证。[结果]花穗发育持续期模型均方根误差为3.6~3.7 d,相关系数0.97,盲测数据集验证相关系数0.98~0.99;开花持续期模型均方根误差1.2~2.6 d,相关系数0.88~0.97,盲测数据集验证相关系数为0.96~0.98。大于5℃日积温、日平均温度、风级和降雨量对荔枝开花过程有显著影响,大于24℃和18℃日积温分别对花穗发育期和开花续期起较大作用,上述因子共同构成影响荔枝开花过程的关键气象要素。[结论]建立的模型具有高鲁棒性和预测拟合度,有助于精准调控荔枝成熟期,所筛选的特征变量有助于理解气象因子对荔枝成花过程的影响。 展开更多
关键词 机器学习 预测模型 物候期 花穗发育持续期 开花持续期
在线阅读 下载PDF
基于自动化机器学习构建胆总管结石自发排石预测模型及应用程序
20
作者 陈健 夏开建 +3 位作者 高福利 刘罗杰 王甘红 徐晓丹 《临床肝胆病杂志》 北大核心 2025年第3期518-527,共10页
目的鉴于胆总管结石患者治疗决策的复杂性,本研究利用自动化机器学习算法,开发一款能够预测胆总管结石患者自发排石的预测模型及应用程序,从而减少非必要内镜逆行胰胆管造影(ERCP)。方法回顾性收集2022年1月—2024年6月通过影像学手段... 目的鉴于胆总管结石患者治疗决策的复杂性,本研究利用自动化机器学习算法,开发一款能够预测胆总管结石患者自发排石的预测模型及应用程序,从而减少非必要内镜逆行胰胆管造影(ERCP)。方法回顾性收集2022年1月—2024年6月通过影像学手段明确诊断胆总管结石后拟行ERCP取石的患者数据,数据来自常熟市第一人民医院(数据集1)和常熟市中医院(数据集2),共835例。数据集1用于机器学习模型训练、内部验证和开发应用程序,数据集2用于外部测试。纳入22个潜在预测变量,用于构建和内部验证LASSO回归模型及自动化机器学习模型。通过受试者操作特征曲线下面积(AUC)、敏感度、特异度、准确率等评估模型性能,选取最佳模型。使用特征重要性图、力图和SHAP图对模型进行解释。利用Python Dash库和最佳模型构建Web应用程序,在数据集2上进行外部测试。使用Kolmogorov-Smirnov检验确定数据是否符合正态分布;对于不符合正态分布的连续变量,使用Mann-Whitney U检验进行2组间比较;分类变量通过χ^(2)检验或Fisher精确检验来分析组间差异。结果纳入835例患者中,152例(18.20%)出现自发排石。在训练集(n=588)和验证集(n=171)中,LASSO模型的AUC分别为0.875、0.864,重要性排名前5的预测因素为单发胆总管结石、胆总管不扩张、胆总管结石直径、血清ALP降低和GGT降低。通过自动化机器学习构建了55个模型,其中梯度提升机(GBM)表现最佳,其AUC为0.891,95%CI为0.859~0.927,优于极端随机树(XRT)、深度学习(DL)、广义线性模型(GLM)和分布式随机森林(DRF)模型。在测试集(n=76)中,GBM模型的预测准确率、敏感度和特异度分别为0.855、0.846和0.857。变量重要性分析显示,单发胆总管结石、胆总管不扩张、胆总管结石直径<8 mm、血清ALP降低和GGT降低这5个因素对预测自发排石具有重要影响。基于GBM模型的SHAP图分析显示,当患者出现单发胆总管结石、胆总管不扩张、胆总管结石直径<8 mm、血清ALP及GGT降低时,出现自发性排石的概率明显增加。结论基于自动化机器学习算法构建的GBM模型及应用程序,在预测胆总管结石患者自发排石方面展现出良好的预测性能和使用便捷性。该应用程序能够帮助避免非必要的ERCP,从而降低手术风险和医保支出。 展开更多
关键词 胆总管结石病 胰胆管造影术 内窥镜逆行 机器学习 预测模型
在线阅读 下载PDF
上一页 1 2 71 下一页 到第
使用帮助 返回顶部