期刊文献+
共找到285篇文章
< 1 2 15 >
每页显示 20 50 100
基于SHAP可解释特征优选的撂荒耕地遥感提取 被引量:2
1
作者 林娜 全海琳 +5 位作者 李双桃 肖茂池 李博远 杨凯 王斌 李南洁 《农业工程学报》 北大核心 2025年第14期291-302,共12页
耕地是粮食生产的重要组成部分,高效、准确地提取撂荒耕地对土地管理和农业规划具有重要意义。该研究以重庆奉节县平安乡为研究区,基于国产高分卫星遥感影像,提取了光谱、光谱指数、纹理、邻域及地形共34个特征,提出了一种Spearman相关... 耕地是粮食生产的重要组成部分,高效、准确地提取撂荒耕地对土地管理和农业规划具有重要意义。该研究以重庆奉节县平安乡为研究区,基于国产高分卫星遥感影像,提取了光谱、光谱指数、纹理、邻域及地形共34个特征,提出了一种Spearman相关系数和SHAP(Shapley additive explanations)相结合的特征优选方法,探讨了6种特征组合方案和6种分类算法的适用性,最终通过分类后比较法提取撂荒耕地。结果表明:1)在光谱和光谱指数特征的基础上,地形、纹理及邻域特征的加入均能有效提升分类精度,其中地形特征贡献最大。总体而言,优选特征主要包括坡度、红波段、绿波段、蓝波段和差值植被指数。2)所有算法在方案六(Spearman+SHAP)中表现最佳,2019年和2020年的平均(总体精度,overau accuracy,OA)分别为90.24%和95.83%。其中,CatBoost算法的分类精度最高,2019年的OA和Kappa系数分别为92.14%和87.37%,2020年的OA和Kappa系数分别为97.86%和96.59%。3)研究区2019—2020年的撂荒耕地面积为3.55 km^(2),撂荒率为16.94%,撂荒识别精度达92.71%,面积重叠率达83.76%。综上,该文提出的方法在撂荒耕地提取中表现出较高的准确性和适用性,可为后续撂荒监测提供一定的技术支持和参考。 展开更多
关键词 高分卫星 遥感 shap 特征优选 撂荒耕地
在线阅读 下载PDF
基于LightGBM和SHAP算法的致密油储层孔隙度预测 被引量:1
2
作者 王伟 党海龙 +3 位作者 康胜松 肖前华 丁磊 石立华 《油气地质与采收率》 北大核心 2025年第5期90-99,共10页
为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型... 为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型,与GBDT和XGBoost算法模型进行了预测效果的综合对比,并利用SHAP算法对LightGBM模型的输出结果进行了可视化解释分析。研究结果表明:LightGBM模型在训练数据集和测试数据集上的预测决定系数分别为0.984和0.855,模型预测准确度高、泛化能力强,综合预测效果好于GBDT和XGBoost模型。应用SHAP算法对LightGBM模型结果的可解释性进行分析,结果表明,影响LightGBM孔隙度预测模型最重要的5项测井参数为密度、阵列感应电阻率、自然伽马、声波时差和光电吸收截面指数。在研究区某单井X致密层段孔隙度的预测实例中,LightGBM模型预测准确度达93.9%,分别高于GBDT和XGBoost模型的预测准确度86.53%和89.08%;训练时长为0.016 s,分别为GBDT和XGBoost模型训练时长的0.096倍和0.025倍;预测时长为0.01 s,分别为GBDT和XGBoost模型预测时长的0.42倍和0.19倍;LightGBM模型的预测效率相对GBDT和XGBoost模型具有明显优势,其在取心井段上对孔隙度的预测误差更小,预测能力更强,且能更好地拟合低值孔隙度。该方法的应用不仅解决了单井致密层段获取完整准确孔隙度分布的难题,而且提高了孔隙度预测的精度和效率,对致密油储层的评价及高效勘探开发具有一定的参考价值。 展开更多
关键词 致密油储层 机器学习 LightGBM算法 shap算法 孔隙度预测
在线阅读 下载PDF
基于特征工程优化和SHAP解释方法预测圆钢管约束混凝土短柱轴压承载力 被引量:1
3
作者 韦建刚 吴洵桢 +1 位作者 郑裔 杨艳 《东南大学学报(自然科学版)》 北大核心 2025年第5期1328-1336,共9页
以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构... 以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构中常见的9个特征的相关性以及冗余性,从13个机器学习模型中筛选出梯度提升树(GBDT)、随机森林(Random Forest)、极端梯度提升(XGBoost)和极端随机树(Extra Trees)四个最优模型对STCC的极限轴压承载力N_(u)进行预测,并采用SHAP可解释方法对4种模型进行可视化对比分析。研究表明:截面含钢率α在统计分析中方差趋于零且与径厚比B/t呈完全负相关关系;约束效应系数ζ在F检验中与N_(u)的显著性水平小于5%,斯皮尔曼、皮尔森以及互信息量相关性分析均表明其与N_(u)弱相关。通过SHAP方法对上述4种模型可视化发现,XGBoost在测试集上的表现尤为突出,其决定系数R^(2)(0.9626)、均方根误差(287.40 kN)、平均绝对误差(139.13 kN)以及平均绝对百分比误差(5.1%)均为4个模型中的最低值。此外,XGBoost在泛化能力和避免过拟合方面也表现出色,因此更适用于STCC短柱轴压承载力预测。 展开更多
关键词 机器学习 特征工程 shap解释方法 圆钢管约束混凝土 轴压承载力 特征重要性分析
在线阅读 下载PDF
大运河文化带新质生产力的时空分异特征与影响因素——基于机器学习XGBoost-SHAP模型 被引量:2
4
作者 周丙锋 史静 +2 位作者 谢新水 刘晟 曹倩倩 《地域研究与开发》 北大核心 2025年第1期14-22,共9页
采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现... 采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现波动增长态势,相比于绿色生产力、科技生产力,数字生产力占新质生产力比例更大。各地区新质生产力发展水平存在一定差异,北京、江苏、浙江部分地级市为新质生产力发展高峰,河南、安徽为新质生产力发展低谷,且2020年各地新质生产力水平均有所提升。其聚集效应沿大运河呈现“三角”分布现象,且表现出“两角聚集夹分异”的发展趋势。每百人移动电话用户数、全要素劳动生产率等为影响大运河文化带新质生产力水平的主导因素,且各个主导因素之间存在交互效应。 展开更多
关键词 新质生产力 大运河文化带 时空分异 XGBoost-shap模型
在线阅读 下载PDF
基于CatBoost和SHAP的高级别自动驾驶车辆非预期停车冲突风险预测
5
作者 刘擎超 王瑞海 +2 位作者 蔡英凤 王海 陈龙 《汽车安全与节能学报》 北大核心 2025年第1期170-180,共11页
针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,... 针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,构建了冲突风险预测模型。结果表明,接管次数在城市中心、住宅区和郊区分别为161次、227次和164次,最高单路段接管次数分别为11次、11次和16次;模型预测精度达93%以上。SHAP分析显示,前后车辆间相对速度和相对位置对冲突风险的影响显著。研究结果对提升自动驾驶车辆的可靠性和安全性具有重要意义。 展开更多
关键词 冲突风险 交通排放 高级别自动驾驶 CatBoost算法 shap解释模型
在线阅读 下载PDF
采用SHAP的高压涡轮级高维设计空间数据挖掘
6
作者 杨昭 郭振东 +2 位作者 苏鹏飞 汪祺能 宋立明 《西安交通大学学报》 北大核心 2025年第6期144-154,共11页
为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的... 为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的分析方法,可视化表示了改善级总体性能的设计变量所影响的涡轮级的具体位置;同时,充分发挥SHAP局部解释的优势,在设计空间中选取典型样本进行归因分析,研究了各设计变量在样本性能指标变化中所发挥的作用。研究发现,对于高压涡轮级,影响级效率的显著变量包括有效出气角、静叶三维积叠参数、叶片吸力面前缘附近样条控制点等。基于GE-E3高压涡轮数据集进行数据挖掘归纳得到涡轮级设计准则:减小动叶中间截面有效出气角、增大静叶中间截面有效出气角,静叶三维积叠点周向顶部位置、周向中间位置向压力面偏移,静叶中间截面、动叶中间截面吸力面前缘附近控制点均向叶片变薄方向移动。遵循设计准则得到的最终设计使级效率提高了0.65%。 展开更多
关键词 高压涡轮级 高维设计空间 数据挖掘 shap方法
在线阅读 下载PDF
基于微震及SHAP机器学习的高位崩塌落石分类识别
7
作者 杨宗佶 黄志勇 +1 位作者 庞博 武钊颖 《人民长江》 北大核心 2025年第9期10-19,82,共11页
高位崩塌落石灾害具有速度快、能量大和监测难度高的特点,对传统的接触式监测预警带来极大挑战。为此,引入机器学习及SHAP方法,结合微震现场监测,建立了分类判识模型,量化了各特征指标对模型决策的贡献度,从而提升了模型的分类准确性和... 高位崩塌落石灾害具有速度快、能量大和监测难度高的特点,对传统的接触式监测预警带来极大挑战。为此,引入机器学习及SHAP方法,结合微震现场监测,建立了分类判识模型,量化了各特征指标对模型决策的贡献度,从而提升了模型的分类准确性和特征可解释性。通过STA/LTA算法和人工选择,构建了震裂山体的崩塌落石事件目录。基于16968个微震事件,结合时域、频域和时频域等60个地震特征指标和Autoencoder提取的16个潜在特征指标,作为机器学习分类判识模型的输入指标,通过随机搜索算法优化模型,最终实现了99%的分类识别准确率;根据SHAP值排序选取前9个最具贡献的指标,发现地震特征指标中波形增大衰减比、DFT平均比率等9个指标在两个模型中均是主要贡献特征,并基于此构建了简化后的分类指标体系。结果表明:简化模型不仅显著节省了计算资源,提高了计算速度,还保持了分类准确率。研究证明了微震监测技术结合可解释机器学习算法不仅能快速、准确地识别落石事件,还能增强模型的可解释性,为高位崩塌落石的早期识别和监测预警提供了新的解决方案。 展开更多
关键词 崩塌落石 微震监测 shap 机器学习 监测预警
在线阅读 下载PDF
基于CatBoost-SHAP-MCM模型的关中地区PM_(2.5)浓度的气象影响因素研究
8
作者 苏佳 聂达文 +3 位作者 李晓萌 张新生 宋金昭 董明放 《环境科学研究》 北大核心 2025年第4期787-797,共11页
为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同... 为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同时利用CatBoost-SHAP-MCM模型识别PM_(2.5)浓度的关键气象影响因素。结果表明:①关中地区PM_(2.5)浓度呈明显的空间分布和季节变异性。年际PM_(2.5)浓度在2021年最低,为42.93μg/m^(3),在2022年最高,达49.09μg/m^(3)。季度和月际变化较为相似,均呈冬季高、夏季低的特征,冬季污染最严重,PM_(2.5)浓度达84.35μg/m^(3),夏季最轻,为21.42μg/m^(3)。西安市、咸阳市和渭南市为高污染城市,铜川市和宝鸡市为低污染城市。②PM_(2.5)浓度与PM10浓度的相关性最高,与CO浓度、SO2浓度相关性均较低。③露点温度、气温、海平面气压、降水量和地面气压为关键气象影响因素,其在各城市表现出显著的影响作用,对关中地区整体和各城市的影响基本保持一致。④在低露点温度、低气温以及低露点温度、高海平面气压和高地面气压等特定因素组合下,其对PM_(2.5)浓度的影响更为显著。研究显示,关中地区PM_(2.5)浓度具有明显的空间分异特征和季节性变化特征,且与露点温度、气温、海平面气压、降水量和地面气压等气象因素密切相关,在特定气象组合条件下PM_(2.5)浓度波动更为显著。 展开更多
关键词 关中地区 PM_(2.5) 影响因素 CatBoost-shap-MCM模型
在线阅读 下载PDF
北京市轨道交通站点功能演变及驱动因素:基于机器学习XGBoost-SHAP模型
9
作者 周丙锋 曹倩倩 +3 位作者 谢新水 朱珊 史静 钱昊 《科学技术与工程》 北大核心 2025年第26期11346-11357,共12页
轨道交通站点的功能综合反映了城市土地利用状况和城市空间活力。轨道交通站点与城市用地的和谐发展,对于优化城市交通、提升土地使用效率具有显著的正面影响。首先运用信息熵测算站点功能多样性,进一步运用优势度与均匀度探究站点功能... 轨道交通站点的功能综合反映了城市土地利用状况和城市空间活力。轨道交通站点与城市用地的和谐发展,对于优化城市交通、提升土地使用效率具有显著的正面影响。首先运用信息熵测算站点功能多样性,进一步运用优势度与均匀度探究站点功能演变的空间分布特征和结构特征,最后使用XGBoost-SHAP机器学习模型探讨了其驱动因素以及它们之间的交互效应。研究表明:从时间维度上看,2012—2023年间站点功能信息熵总体呈现波动下降趋势。从空间维度上看,二环内变化型站点居多,二环至五环相对稳定,五环至六环站点变化明显,整体站点功能动态不稳定,变化型站点占比高达76%。从结构维度上看,站点功能构成经历了明显的变化,商服型和交通型站点增长,居住型、产业型及公共型站点减少或波动下降。从驱动因素上看,站点范围内的POI(point of interest)数量、路网密度和生产总值等是影响北京地铁站点功能混合度水平的主导因素,且各个主导因素之间存在交互效应。本文研究结果对于改善地铁站点周边土地的使用效率和增强站点的活力具有重要意义。 展开更多
关键词 轨道交通站点 站点功能演变 驱动因素 XGBoost-shap 北京市
在线阅读 下载PDF
基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型
10
作者 盛武 王灵子 《工矿自动化》 北大核心 2025年第6期21-27,140,共8页
针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特... 针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特征变量;基于XGBoost搭建上隅角瓦斯浓度预测模型,引入SHAP算法计算每个特征变量对预测结果的贡献值,增强模型透明度,为XGBoost提供全局性解释;最后利用现场多源传感监测数据对模型性能进行验证。实例分析结果表明:①XGBoost模型的决定系数R^(2)、平均绝对误差(MAE)、均方根误差(RMSE)分别为0.93,0.007,0.008,相较于随机森林(RF)、支持向量回归(SVR)和梯度提升决策树(GBDT),拟合优度最高,误差最低。②XGBoost模型的平均相对误差为4.478%,相较于对比模型,具有较高的精度与较好的泛化性能。③依据各输入特征的平均绝对SHAP值,工作面T1瓦斯浓度对上隅角瓦斯浓度影响最大,工作面上隅角瓦斯抽采管道内瓦斯浓度次之,回采煤层瓦斯含量、回采煤层顶板压力等紧随其后,说明XGBoost能捕捉变量间的非线性关系和交互作用,SHAP算法可为XGBoost模型提供全局性解释。 展开更多
关键词 瓦斯浓度预测 上隅角瓦斯溯源 XGBoost模型 shap 可解释性
在线阅读 下载PDF
基于机器学习和SHAP算法的声波测井曲线重构及可解释性分析 被引量:7
11
作者 黎子豪 蒋恕 《地质科技通报》 北大核心 2025年第1期321-331,共11页
测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间... 测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间的关系模型使得曲线重构精度相对较低,机器学习算法虽能在大量数据之间找到最为合适的数据映射关系进而提高模型精度,但相较而言其所构建的黑箱模型无法得到良好的解释。近期,可解释性算法的运用使得机器学习在重构测井曲线中的应用更为合理。通过将支持向量回归(support vector regression,简称SVR),随机森林(random forest,简称RF)以及极限梯度提升(extreme gradient boosting,简称XGBoost)和传统多元线性回归方法(linear regression,简称LR)的对比对英国能源局22-30b-11号井声波测井曲线进行了模型重构并基于shapley additive explanations(SHAP)算法对XGBoost模型进行了解释。结果表明,XGBoost在测试集上的决定系数(R2)和均方误差(MSE)分别为0.996,6.371,优于SVR的0.990、15.755和RF的0.993、9.871,而传统多元线性回归方法则为0.969、48.895,表明XGBoost对声波时差曲线的重构具有更高的准确度和更好的泛化性能。创新性地采用SHAP算法对XGBoost黑箱模型的解释表明,在模型构建选择重要特征时,XGBoost模型采用地层温度数据作为特征明显合理于多元线性回归方法采用的井径测井数据。最后基于SHAP对模型进行了单点和全局特征交互解释。上述结果表明在声波测井曲线重构方面,机器学习算法明显优于传统的多元线性回归方法,并证明了SHAP算法在声波测井曲线重构机器学习模型解释方面的可行性,为后续机器学习在测井解释中的发展提供了新的思路。 展开更多
关键词 测井曲线重构 机器学习 模型解释 shap算法 声波测井
在线阅读 下载PDF
基于XGBoost-SHAP方法的陕西省PM_(2.5)影响因素分析 被引量:4
12
作者 赵兴赟 张强 +4 位作者 杨方社 郑烈龙 罗嘉昕 史治辉 问思路 《环境科学研究》 北大核心 2025年第5期990-999,共10页
陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气... 陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气污染物数据集,对陕西省PM_(2.5)浓度的时空变化特征进行研究,通过构建XGBoost模型并结合SHAP方法,分析陕西省PM_(2.5)浓度与气象、地形及植被因素和社会经济因素的关系,阐明各因素对PM_(2.5)浓度的时空影响。结果表明:①时间上,2013−2022年陕西省PM_(2.5)浓度整体呈现下降趋势,年均浓度最大值(56.02μg/m^(3))出现在2013年,在2019−2022年PM_(2.5)年均浓度低于《环境空气质量标准》(GB 3095−2012)二级标准限值(35μg/m^(3));空间上,陕西省呈现“关中高、陕南和陕北低”的污染空间格局。②在所研究的影响因素中,XGBoost-SHAP方法揭示了影响陕西省PM_(2.5)浓度的主要因素依次为高程、相对湿度、温度和人口密度,其中,高程和相对湿度对陕西省PM_(2.5)浓度具有负向影响,而温度和人口密度则表现为正向影响。③通过划分影响区发现,陕北、关中及陕南地区PM_(2.5)主要影响因素的作用方向与影响强度存在显著的空间异质性。研究显示,2013−2022年陕西省PM_(2.5)浓度大幅下降,PM_(2.5)的主要影响因素在不同区域存在空间差异,治理PM_(2.5)污染需要综合考虑区域异质性与多重影响因素的协同作用。 展开更多
关键词 PM_(2.5) XGBoost模型 shap方法 时空特征 影响因素
在线阅读 下载PDF
应用SHAP可解释机器学习模型估测森林蓄积量 被引量:1
13
作者 王元 王玥 +3 位作者 周宇琛 陈伏生 张绿水 刘牧 《东北林业大学学报》 北大核心 2025年第5期66-73,共8页
森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国... 森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国家森林资源连续清查的地面实测数据,分析不同影像特征参数在森林蓄积量反演中的贡献率。结果表明:对比多元线性回归、神经网络、随机森林和XGBoost模型估测森林蓄积量的精度,随机森林模型估测精度为93.3%,决定系数(R^(2))为0.9337,均方根误差为2.2323,平均绝对误为2.3395;与BP神经网络模型(R^(2)=0.8219)和XGBoost模型(R^(2)=0.7916)相比,模型拟合度和预测效果更佳,比多元线性回归模型(R^(2)=0.688)处理非线性关系的稳定性和可靠性更高。通过解释特征参数的相对重要性,揭示出平均胸径、郁闭度等特征对森林蓄积量影响显著,且随机森林模型中各因子间存在相互作用。 展开更多
关键词 shap解释模型 机器学习模型 森林蓄积量
在线阅读 下载PDF
基于SHAP的可解释机器学习的滑坡易发性评价模型 被引量:6
14
作者 崔婷婷 安雪莲 +2 位作者 孙德亮 陈东升 朱有晨 《成都理工大学学报(自然科学版)》 北大核心 2025年第1期153-172,共20页
机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过... 机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过随机森林、XGBoost(eXtreme Gradient Boosting)以及深度随机森林机器学习算法结合贝叶斯优化算法分别构建滑坡易发性评价模型;利用混淆矩阵及受试者工作特征曲线开展评价精度验证;基于4种分级方法得到滑坡易发性区划图;通过SHAP分析影响滑坡发育的主导因子。结果表明,优化后的XGBoost模型受试者工作特征曲线下面积(AUC)值(0.817)高于随机森林的AUC值(0.803)和深度随机森林的AUC值(0.806);不同分级方式下的易发性区划图分布差异很大,其中基于相等间隔法和XGBoost模型的分级效果相对更好,极高-高易发区主要集中在研究区的东南部和东北部,特别是长江及其支流两岸。SHAP图揭示各主导因子不同特征值对滑坡发育有明显差异,高程和距河流距离是研究区滑坡发育的主要影响因子,对滑坡发育贡献显著。本研究的XGBoost模型具有较高的预测精度,模型可解释性强,为滑坡灾害的精准防治提供科学依据。 展开更多
关键词 XGBoost 深度随机森林 shap 三峡库区 滑坡易发性评价
在线阅读 下载PDF
融合XGBoost和SHAP的混凝土抗压强度预测分析模型 被引量:1
15
作者 刘聪林 李盛 +2 位作者 崔晓宁 蔡磊 张建功 《水利水电技术(中英文)》 北大核心 2025年第2期246-258,共13页
【目的】为精准预测混凝土抗压强度、突出XGBoost模型的预测优势和实现XGBoost模型的可解释功能,【方法】构建以水泥、龄期、水等8种影响因素为输入特征和以抗压强度为目标特征的1030个样本数据集,建立支持向量回归(SVR)、随机森林(RF)... 【目的】为精准预测混凝土抗压强度、突出XGBoost模型的预测优势和实现XGBoost模型的可解释功能,【方法】构建以水泥、龄期、水等8种影响因素为输入特征和以抗压强度为目标特征的1030个样本数据集,建立支持向量回归(SVR)、随机森林(RF)和极端梯度提升树(XGBoost)机器学习算法模型,开展混凝土抗压强度预测研究,将XGBoost模型和ACI209公式的预测结果对比,同时,引入SHAP模型对XGBoost模型进行解释和分析。【结果】结果表明:XGBoost模型的预测精度最高,R^(2)为0.952,MAE为2.48,MAPE为9.16,RMSE为3.58,但XGBoost模型对小于30 MPa的低抗压强度样本的预测误差较大,随着抗压强度的增大,XGBoost模型的预测精度提高,超限样本比例从25%下降到2.7%;与ACI209公式的预测结果相比,XGBoost模型在龄期56 d和100 d样本的预测值绝对误差率均值为4.10%,3.64%,而ACI209公式则为11.27%,17.96%。【结论】XGBoost模型适用于混凝土强度大于30 MPa的样本的预测;SHAP模型不仅可以定量地给出特征重要性排序,还能定性地给出每个特征参数是对抗压强度的影响规律,能为混凝土相关研究及其他需要对机器学习模型进行解释的研究提供参考。 展开更多
关键词 机器学习 XGBoost shap 抗压强度预测 混凝土 力学性能
在线阅读 下载PDF
基于XGBoost-SHAP的奶牛热应激预测与可解释性研究
16
作者 严格齐 焦洪超 +3 位作者 林海 李浩 施正香 王朝元 《农业机械学报》 北大核心 2025年第4期408-414,共7页
为提高奶牛热应激预测模型的准确性和可解释性,本研究采用奶牛红外体表温度和热应激潜在影响因子作为特征,基于极限梯度提升算法(XGBoost)构建个体热应激预测模型,并引入基于Shapley值的可加性特征归因算法(SHapley Additive exPlanatio... 为提高奶牛热应激预测模型的准确性和可解释性,本研究采用奶牛红外体表温度和热应激潜在影响因子作为特征,基于极限梯度提升算法(XGBoost)构建个体热应激预测模型,并引入基于Shapley值的可加性特征归因算法(SHapley Additive exPlanations,SHAP)解释预测结果。选取了躯干、前乳(UD)、脸部以及眼部的最高温度(IRTmax)和平均温度(IRTave)作为体表温度变量,并结合环境参数和奶牛相关变量构建了特征子集。结果显示,热应激情况下,奶牛4个部位的IRTmax和IRTave均显著高于无热应激情况(p<0.01)。对比随机森林、自适应提升和梯度提升树模型,结果表明,使用前乳平均温度(IRTave_UD)作为输入特征,并经过网格搜索优化的XGBoost模型在预测奶牛热应激方面表现最佳,其准确率为80.8%,F1值为79.2%,ROC曲线下面积(AUC)为0.873。SHAP分析表明,前乳平均温度(IRTave_UD)与热应激发生呈正相关,而泌乳天数与其呈负相关,这两者可作为奶牛热应激识别的关键指标。研究结果可为奶牛舍夏季精准降温管理提供技术支持和参考。 展开更多
关键词 奶牛 热应激 机器学习 可解释性 XGBoost shap
在线阅读 下载PDF
基于机器学习的合金钢拉伸性能预测及SHAP特征分析
17
作者 曹健 刘立忠 +1 位作者 李耀威 刘双 《材料与冶金学报》 北大核心 2025年第4期393-402,共10页
利用数据驱动的机器学习方法,将成形工艺和化学成分作为输入特征,对材料的屈服强度、抗拉强度和伸长率进行预测.采用局部离群因子(LOF)法对样本进行有效的异常值检测剔除,建立支持向量机回归、随机森林、极限梯度提升和多层感知机4种机... 利用数据驱动的机器学习方法,将成形工艺和化学成分作为输入特征,对材料的屈服强度、抗拉强度和伸长率进行预测.采用局部离群因子(LOF)法对样本进行有效的异常值检测剔除,建立支持向量机回归、随机森林、极限梯度提升和多层感知机4种机器学习算法,并对算法进行网格搜索超参数及5折交叉验证.结果表明,除支持向量机回归外的3种算法均表现出较好的拟合效果.结合沙普利可加性模型解释(SHAP)方法和特征重要性分析,为机器学习算法的预测过程增加可解释性,分析样本特征对合金钢拉伸性能的影响. 展开更多
关键词 机器学习 合金钢 拉伸性能 shap
在线阅读 下载PDF
基于无人机图像和SHAP特征筛选的小麦田间产量预测方法研究
18
作者 朱志畅 葛焱 +4 位作者 臧晶荣 李庆 金时超 徐焕良 翟肇裕 《麦类作物学报》 北大核心 2025年第2期264-274,共11页
为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间... 为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间预测能力的差异;同时,引入机器学习事后可解释性方法SHAP对输入的特征变量进行重要性分析和筛选,了解其提高模型预测能力的效果。结果表明:(1)10种机器学习模型中,误差逆传播神经网络BPNN的产量预测表现最好(r^(2)=0.826,RMSE=0.094 t·hm^(-2));(2)根据SHAP确定的特征变量重要性排序,花青素反射指数ARI和三维冠层体积Volume对于预测结果的影响最大,占全部特征重要性总和的45.48%;(3)经过SHAP特征筛选后,确定了在BPNN产量预测模型上表现最优的9个特征变量,其预测结果r^(2)为0.865,RMSE为0.075 t·hm^(-2),比使用全特征的BPNN和事前Pearson相关性分析方法在预测精度上均有提升。因此,在优选产量预测模型基础上,可采用SHAP机制对特征变量的重要性进行筛选和分析,以此进一步提高田间小麦产量预测精度。 展开更多
关键词 小麦 无人机图像 机器学习 shap加性解释方法 产量预测
在线阅读 下载PDF
基于XGBoost-SHAP模型的流域水质指标对DO的驱动与协同影响分析 被引量:1
19
作者 南淑荷 李进军 +2 位作者 魏佳芳 魏荣升 赵天赐 《水电能源科学》 北大核心 2025年第7期52-56,共5页
溶解氧(DO)是衡量水质健康的关键指标,其变化受多种环境因子和交互作用的影响。为此,基于2021年1月~2022年4月钱塘江浙闽片河流闸口水质数据,采用极端梯度提升(XGBoost)算法构建DO预测模型,并结合SHAP(Shapley值)方法分析水质指标对DO... 溶解氧(DO)是衡量水质健康的关键指标,其变化受多种环境因子和交互作用的影响。为此,基于2021年1月~2022年4月钱塘江浙闽片河流闸口水质数据,采用极端梯度提升(XGBoost)算法构建DO预测模型,并结合SHAP(Shapley值)方法分析水质指标对DO的驱动作用及其交互效应。结果表明,水温(WT)、pH值是影响DO变化的主要因素,对模型输出的贡献分别为42.7%、20.9%。此外,WT与pH值的非线性交互关系尤为显著。低WT、pH值促进DO浓度,而高WT、pH值则可能降低DO浓度。WT与浊度(TB)的交互作用显著降低DO浓度,而适量的总磷、电导率对DO浓度具有正向促进作用。研究结果可为流域水质管理和生态保护提供科学依据。 展开更多
关键词 溶解氧(DO) 水质预测 XGBoost shap 非线性交互 流域水质管理
在线阅读 下载PDF
SHAP解释下随机森林预测的越江盾构隧道病害发展分析 被引量:1
20
作者 徐鹏宇 王勇 +1 位作者 王红雪 高翔 《测绘通报》 北大核心 2025年第3期117-121,共5页
我国轨道交通建造技术愈发成熟,但也无法改变富水环境下隧道变形的现状。工程领域对隧道病害成因、影响因素、控制与治理等方面均有较为深入的研究,但对于隧道尤其是越江盾构隧道的病害分布与发展预测领域的研究却很少。为弥补越江盾构... 我国轨道交通建造技术愈发成熟,但也无法改变富水环境下隧道变形的现状。工程领域对隧道病害成因、影响因素、控制与治理等方面均有较为深入的研究,但对于隧道尤其是越江盾构隧道的病害分布与发展预测领域的研究却很少。为弥补越江盾构隧道病害发展预测领域的空白,本文基于三维激光测量技术对某越江段盾构隧道全断面扫描的历史监测数据,利用SHAP解释的随机森林模型预测未来一期监测数据;预测结果精度评估合格后,分析预测数据判断隧道变形发生位置和程度,为地铁运营维护提供依据。 展开更多
关键词 病害发展分析 越江盾构隧道 病害预测 shap 随机森林
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部