期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
缺资料地区可解释性混合机器学习模型中长期径流预报
1
作者 由宇军 白云岗 +4 位作者 卢震林 张江辉 曹彪 李文忠 余其鹰 《长江科学院院报》 北大核心 2025年第7期52-59,共8页
在无资料地区气象、水文等观测资料缺乏,影响径流预报的准确性,直接影响水文预报和防汛抗旱工作的开展。分析无资料地区现有的降水、气温和径流数据在中长期预报中的适用性,进而实现径流预报非常重要。分别采用卷积神经网络算法(CNN)、... 在无资料地区气象、水文等观测资料缺乏,影响径流预报的准确性,直接影响水文预报和防汛抗旱工作的开展。分析无资料地区现有的降水、气温和径流数据在中长期预报中的适用性,进而实现径流预报非常重要。分别采用卷积神经网络算法(CNN)、双向门控循环神经网络(BiGRU)、注意力机制(Attention)和优化粒子群算法(IPSO)构建CNN-BiGRU-Attention、IPSO-CNN-BiGRU-Attention组合模型,再与门控循环单元模型(GRU)和ABCD水量平衡模型进行对比分析,并在玉龙喀什河进行综合评估,并结合SHAP可解释性机器学习方法探究最优模型中输入特征对径流影响的贡献程度。结果表明:加入降水和气温的组合模型IPSO-CNN-BiGRU-Attention预测精度整体优于CNN-BiGRU-Attention、GRU模型,与实际值能够较好地吻合;随着预见期的增加,提出的组合模型在验证期内均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分误差(MAPE)、纳什效率系数(NSE)分别为2.11、1.32 m^(3)/s、73.76%和0.94,并且在前3个月预报精度最高。该方法在缺资料地区月径流预报中具有较好的效果。 展开更多
关键词 径流预报 缺资料地区 shap可解释性机器学习方法 组合模型IPSO-CNN-BiGRU-Attention 预测精度
在线阅读 下载PDF
基于XGBoost-SHAP的奶牛热应激预测与可解释性研究
2
作者 严格齐 焦洪超 +3 位作者 林海 李浩 施正香 王朝元 《农业机械学报》 北大核心 2025年第4期408-414,共7页
为提高奶牛热应激预测模型的准确性和可解释性,本研究采用奶牛红外体表温度和热应激潜在影响因子作为特征,基于极限梯度提升算法(XGBoost)构建个体热应激预测模型,并引入基于Shapley值的可加性特征归因算法(SHapley Additive exPlanatio... 为提高奶牛热应激预测模型的准确性和可解释性,本研究采用奶牛红外体表温度和热应激潜在影响因子作为特征,基于极限梯度提升算法(XGBoost)构建个体热应激预测模型,并引入基于Shapley值的可加性特征归因算法(SHapley Additive exPlanations,SHAP)解释预测结果。选取了躯干、前乳(UD)、脸部以及眼部的最高温度(IRTmax)和平均温度(IRTave)作为体表温度变量,并结合环境参数和奶牛相关变量构建了特征子集。结果显示,热应激情况下,奶牛4个部位的IRTmax和IRTave均显著高于无热应激情况(p<0.01)。对比随机森林、自适应提升和梯度提升树模型,结果表明,使用前乳平均温度(IRTave_UD)作为输入特征,并经过网格搜索优化的XGBoost模型在预测奶牛热应激方面表现最佳,其准确率为80.8%,F1值为79.2%,ROC曲线下面积(AUC)为0.873。SHAP分析表明,前乳平均温度(IRTave_UD)与热应激发生呈正相关,而泌乳天数与其呈负相关,这两者可作为奶牛热应激识别的关键指标。研究结果可为奶牛舍夏季精准降温管理提供技术支持和参考。 展开更多
关键词 奶牛 热应激 机器学习 可解释性 XGBoost shap
在线阅读 下载PDF
机器学习模型可解释性方法、应用与安全研究综述 被引量:193
3
作者 纪守领 李进锋 +1 位作者 杜天宇 李博 《计算机研究与发展》 EI CSCD 北大核心 2019年第10期2071-2096,共26页
尽管机器学习在许多领域取得了巨大的成功,但缺乏可解释性严重限制了其在现实任务尤其是安全敏感任务中的广泛应用.为了克服这一弱点,许多学者对如何提高机器学习模型可解释性进行了深入的研究,并提出了大量的解释方法以帮助用户理解模... 尽管机器学习在许多领域取得了巨大的成功,但缺乏可解释性严重限制了其在现实任务尤其是安全敏感任务中的广泛应用.为了克服这一弱点,许多学者对如何提高机器学习模型可解释性进行了深入的研究,并提出了大量的解释方法以帮助用户理解模型内部的工作机制.然而,可解释性研究还处于初级阶段,依然还有大量的科学问题尚待解决.并且,不同的学者解决问题的角度不同,对可解释性赋予的含义也不同,所提出的解释方法也各有侧重.迄今为止,学术界对模型可解释性仍缺乏统一的认识,可解释性研究的体系结构尚不明确.在综述中,回顾了机器学习中的可解释性问题,并对现有的研究工作进行了系统的总结和科学的归类.同时,讨论了可解释性相关技术的潜在应用,分析了可解释性与可解释机器学习的安全性之间的关系,并且探讨了可解释性研究当前面临的挑战和未来潜在的研究方向,以期进一步推动可解释性研究的发展和应用. 展开更多
关键词 机器学习 可解释性 解释方法 解释机器学习 安全性
在线阅读 下载PDF
奥运奖牌可以被预测吗?——基于可解释机器学习视角 被引量:1
4
作者 石慧敏 章东迎 章永辉 《上海体育大学学报》 CSSCI 北大核心 2024年第4期26-36,共11页
基于1992-2021年夏季奥运会的分项目成绩大数据,使用随机森林模型评估不同项目金牌和奖牌的可预测性,发现各项目存在较大的差异:对奖牌而言,可预测性最强的是乒乓球、羽毛球和游泳,而最弱的是水球、现代五项和排球。基于可解释机器学习... 基于1992-2021年夏季奥运会的分项目成绩大数据,使用随机森林模型评估不同项目金牌和奖牌的可预测性,发现各项目存在较大的差异:对奖牌而言,可预测性最强的是乒乓球、羽毛球和游泳,而最弱的是水球、现代五项和排球。基于可解释机器学习方法挖掘社会经济因素对奥运奖牌的影响发现:(1)对同一个项目而言,女子项目的可预测准确性普遍高于男子项目;(2)代表队所在地区的人口规模、人均GDP、是否为主办国等因素对奖牌总数具有一定影响;(3)在特定项目上,代表队的传统优势(如中国的乒乓球、美国的田径等)对奖牌预测具有较大影响。 展开更多
关键词 奥运奖牌 机器学习 特征重要性 shap方法 shapLEY值
在线阅读 下载PDF
从SHAP到概率——可解释性机器学习在糖尿病视网膜病变靶向脂质组学研究中的应用 被引量:2
5
作者 金东镇 郭城楠 +7 位作者 彭芳 赵淑珍 李慧慧 夏喆铮 车明珠 王亚楠 张泽杰 毛广运 《中国卫生统计》 CSCD 北大核心 2023年第4期511-515,共5页
目的基于可解释性机器学习算法构建糖尿病视网膜病病变(diabetic retinopathy,DR)的早期识别模型,并探讨SHAP(SHapley Additive exPlanations)在脂质组学数据中的应用。方法基于本项目组的DR靶向脂质组学数据,通过可解释性机器学习的方... 目的基于可解释性机器学习算法构建糖尿病视网膜病病变(diabetic retinopathy,DR)的早期识别模型,并探讨SHAP(SHapley Additive exPlanations)在脂质组学数据中的应用。方法基于本项目组的DR靶向脂质组学数据,通过可解释性机器学习的方法进行特征筛选;在建立糖尿病视网膜病变的早期识别模型后,通过全局、特征和个体三个层面对模型进行解释,并将SHAP值转换成概率以增强可解释的能力。结果本研究筛选出了5种内源性脂质代谢物,构建了一个性能较为优秀的糖尿病视网膜病变的早期识别模型,并成功使用SHAP及概率解锁了模型。结论脂质代谢物质可以应用于糖尿病视网膜病变的早期识别;SHAP在进行黑盒模型的解锁时表现出色,且有较高的实践应用价值。 展开更多
关键词 脂质组学 可解释性机器学习 糖尿病视网膜病变 shap
在线阅读 下载PDF
基于无人机图像和SHAP特征筛选的小麦田间产量预测方法研究
6
作者 朱志畅 葛焱 +4 位作者 臧晶荣 李庆 金时超 徐焕良 翟肇裕 《麦类作物学报》 北大核心 2025年第2期264-274,共11页
为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间... 为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间预测能力的差异;同时,引入机器学习事后可解释性方法SHAP对输入的特征变量进行重要性分析和筛选,了解其提高模型预测能力的效果。结果表明:(1)10种机器学习模型中,误差逆传播神经网络BPNN的产量预测表现最好(r^(2)=0.826,RMSE=0.094 t·hm^(-2));(2)根据SHAP确定的特征变量重要性排序,花青素反射指数ARI和三维冠层体积Volume对于预测结果的影响最大,占全部特征重要性总和的45.48%;(3)经过SHAP特征筛选后,确定了在BPNN产量预测模型上表现最优的9个特征变量,其预测结果r^(2)为0.865,RMSE为0.075 t·hm^(-2),比使用全特征的BPNN和事前Pearson相关性分析方法在预测精度上均有提升。因此,在优选产量预测模型基础上,可采用SHAP机制对特征变量的重要性进行筛选和分析,以此进一步提高田间小麦产量预测精度。 展开更多
关键词 小麦 无人机图像 机器学习 shap加性解释方法 产量预测
在线阅读 下载PDF
基于机器学习的铜电解精炼电积过程电压及出液铜离子浓度预测模型研究
7
作者 闫哲祯 卢金成 +3 位作者 程寒 廖嘉琪 徐夫元 段宁 《有色金属(冶炼部分)》 北大核心 2025年第9期13-24,共12页
电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压... 电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压及出液铜离子浓度准确预测的多参数模型。通过对比研究10种机器学习模型,发现GBR在电压预测中表现最优(决定系数R^(2)=0.79,均方误差MSE=1.25),XGBoost对出液铜离子浓度的预测准确度最高(R^(2)=0.87,MSE=5.58)。SHAP解释性分析表明,电流和时间分别是影响电压和出液铜离子浓度变化的主控因素。模型决策机制与电化学原理及质量守恒定律一致,突破了传统模型对非线性关系的表征局限,为异常工况的预警诊断、关键参数动态优化控制及减少污染物产生提供依据。 展开更多
关键词 铜电积 机器学习 Gradient Boosting Regression(GBR) eXtreme Gradient Boosting(XGBoost) 解释性分析 shapley Additive exPlanations(shap)
在线阅读 下载PDF
基于可解释机器学习的水平井产能预测方法 被引量:20
8
作者 马先林 周德胜 +2 位作者 蔡文斌 李宪文 何明舫 《西南石油大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期81-90,共10页
准确预测致密气藏分段压裂水平井产能是压裂效果评价和优化设计的关键环节。现有的产能预测方法,引入了过多的假设和简化,很难全面反映致密储层流体多尺度的运移机理和复杂物理过程,导致产能预测误差较大。提出一种基于机器学习的致密... 准确预测致密气藏分段压裂水平井产能是压裂效果评价和优化设计的关键环节。现有的产能预测方法,引入了过多的假设和简化,很难全面反映致密储层流体多尺度的运移机理和复杂物理过程,导致产能预测误差较大。提出一种基于机器学习的致密气藏分段压裂水平井产能预测方法,该方法综合利用已收集的地质、压裂水平井产能及钻完井等多类型数据,通过机器学习算法直接挖掘数据内部规律,建立产能预测模型。此外,为解决常规机器学习模型的“黑盒子”问题,还利用SHAP(SHapley Additive exPlanations)方法对建立的机器学习模型进行全局和局部解释,分析影响产能的主要因素,增加了模型的可信性和透明度。以苏里格气田苏东示范区为例,验证了该方法的有效性和实用性。与油气藏数值方法相比,该方法不仅提高了产能预测的精度,而且缩短了建模周期,加快了计算速度。 展开更多
关键词 分段压裂水平井 机器学习 产能预测 可解释性 数据驱动 shap方法
在线阅读 下载PDF
通货膨胀影响因素识别——基于机器学习方法的再检验 被引量:15
9
作者 肖争艳 陈衎 +1 位作者 陈小亮 陈彦斌 《统计研究》 CSSCI 北大核心 2022年第6期132-147,共16页
准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统... 准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统方法的局限,本文综合使用SHAP值解释性方法和SVR等多种非线性机器学习方法,重新识别了2001—2019年间我国所发生的5轮通胀的影响因素。研究结果表明,第一,通胀预期和食品价格上涨是过去20多年间多轮通胀的共同驱动因素;第二,消费和投资等需求拉动因素对通胀的影响逐渐减弱,成本推动因素尤其是劳动力成本对通胀的影响不断增强;第三,货币政策能够通过多种渠道影响通胀走势,并且一直是通胀的重要影响因素。有鉴于此,建议通过加强引导通胀预期、稳定食品生产和供应、营造良好经营环境以缓解劳动成本上涨压力等举措防范通胀风险。此外,不能因为担心通胀压力就过于束缚货币政策的力度,应该在做好金融市场和房地产市场宏观审慎监管的前提下,适当加大货币政策对实体经济的支持力度,以更好地应对我国经济下行压力。 展开更多
关键词 通货膨胀 机器学习 shap解释性方法 通胀预期
在线阅读 下载PDF
混凝土抗压强度的可解释深度学习预测模型 被引量:1
10
作者 章伟琪 王辉明 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期738-744,752,共8页
为快速、准确地预测混凝土抗压强度,采用深度学习技术建立预测模型,使用贝叶斯优化算法进行模型自动优化调节,并结合SHapley Additive exPlanations(SHAP)可解释性方法对预测结果进行分析,以克服预测模型的“黑盒子”问题.利用深度学习... 为快速、准确地预测混凝土抗压强度,采用深度学习技术建立预测模型,使用贝叶斯优化算法进行模型自动优化调节,并结合SHapley Additive exPlanations(SHAP)可解释性方法对预测结果进行分析,以克服预测模型的“黑盒子”问题.利用深度学习模型挖掘各输入特征参数与抗压强度之间潜在的规律;通过可视化输入特征参数的SHAP值分析参数对抗压强度预测结果的重要性及影响规律.结果表明,所建深度学习模型相比其他传统模型具有更好的性能;SHAP分析结果与试验结果一致,该模型较好地反映了各特征参数之间复杂的非线性关系,可为混凝土材料的工程设计提供依据和参考. 展开更多
关键词 混凝土 抗压强度 深度学习 shap方法 可解释性
在线阅读 下载PDF
机器学习驱动的辉光放电等离子体降解碱性紫16性能研究
11
作者 方野 王玉如 +3 位作者 曾静懿 王亚欣 郑伟 李敏睿 《中国环境科学》 EI CAS CSCD 北大核心 2024年第6期3206-3216,共11页
为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特... 为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特征提升(CatBoost)算法训练的模型性能最佳(R^(2)=0.988,MAE=2.050%).此外,沙普利加和解释方法(SHAP)对最佳模型的参数影响程度定量解析结果显示,反应时间(43.74%)、初始污染物浓度(23.00%)、氯化钾浓度(15.65%)和平均电流(12.63%)是影响BV16降解效率的关键因素.同时,基于部分依赖图(PDP)提出了参数交互影响优化方案.所建立的CatBoost-SHAP-PDP模型不仅能实现GDEP对BV16降解效果的模拟预测,而且是优化GDEP降解过程变量的有效方法,为GDEP降解染料废水复杂体系领域的建模与应用提供科学依据和技术支持. 展开更多
关键词 辉光放电等离子体 染料废水 shap解释方法 机器学习
在线阅读 下载PDF
基于最小不满足核的随机森林局部解释性分析 被引量:2
12
作者 马舒岑 史建琦 +2 位作者 黄滟鸿 秦胜潮 侯哲 《软件学报》 EI CSCD 北大核心 2022年第7期2447-2463,共17页
随着机器学习在安全关键领域的应用愈加广泛,对于机器学习可解释性的要求也愈加提高.可解释性旨在帮助人们理解模型内部的运作原理以及决策依据,增加模型的可信度.然而,对于随机森林等机器学习模型的可解释性相关研究尚处于起步阶段.鉴... 随着机器学习在安全关键领域的应用愈加广泛,对于机器学习可解释性的要求也愈加提高.可解释性旨在帮助人们理解模型内部的运作原理以及决策依据,增加模型的可信度.然而,对于随机森林等机器学习模型的可解释性相关研究尚处于起步阶段.鉴于形式化方法严谨规范的特性以及近年来在机器学习领域的广泛应用,提出一种基于形式化和逻辑推理方法的机器学习可解释性方法,用于解释随机森林的预测结果.即将随机森林模型的决策过程编码为一阶逻辑公式,并以最小不满足核为核心,提供了关于特征重要性的局部解释以及反事实样本生成方法.多个公开数据集的实验结果显示,所提出的特征重要性度量方法具有较高的质量,所提出的反事实样本生成算法优于现有的先进算法;此外,从用户友好的角度出发,可根据基于反事实样本分析结果生成用户报告,在实际应用中,能够为用户改善自身情况提供建议. 展开更多
关键词 机器学习可解释性 特征重要性 反事实样本 形式化方法 逻辑推理
在线阅读 下载PDF
基于特征工程优化和SHAP解释方法预测圆钢管约束混凝土短柱轴压承载力
13
作者 韦建刚 吴洵桢 +1 位作者 郑裔 杨艳 《东南大学学报(自然科学版)》 2025年第5期1328-1336,共9页
以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构... 以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构中常见的9个特征的相关性以及冗余性,从13个机器学习模型中筛选出梯度提升树(GBDT)、随机森林(Random Forest)、极端梯度提升(XGBoost)和极端随机树(Extra Trees)四个最优模型对STCC的极限轴压承载力N_(u)进行预测,并采用SHAP可解释方法对4种模型进行可视化对比分析。研究表明:截面含钢率α在统计分析中方差趋于零且与径厚比B/t呈完全负相关关系;约束效应系数ζ在F检验中与N_(u)的显著性水平小于5%,斯皮尔曼、皮尔森以及互信息量相关性分析均表明其与N_(u)弱相关。通过SHAP方法对上述4种模型可视化发现,XGBoost在测试集上的表现尤为突出,其决定系数R^(2)(0.9626)、均方根误差(287.40 kN)、平均绝对误差(139.13 kN)以及平均绝对百分比误差(5.1%)均为4个模型中的最低值。此外,XGBoost在泛化能力和避免过拟合方面也表现出色,因此更适用于STCC短柱轴压承载力预测。 展开更多
关键词 机器学习 特征工程 shap解释方法 圆钢管约束混凝土 轴压承载力 特征重要性分析
在线阅读 下载PDF
融合仿真与机器学习的交织区通行能力协同估计方法
14
作者 荣建 吴培佳 +2 位作者 高亚聪 王益 窦灏 《交通运输系统工程与信息》 2025年第4期206-218,240,共14页
为克服现有方法在交织流量表征和影响因素量化方面的不足,本文融合微观仿真与机器学习方法,构建从仿真标定和影响因素作用机制分析到通行能力估计的研究框架。提出结合DBSCAN(DensityBased Spatial Clustering of Applications with Noi... 为克服现有方法在交织流量表征和影响因素量化方面的不足,本文融合微观仿真与机器学习方法,构建从仿真标定和影响因素作用机制分析到通行能力估计的研究框架。提出结合DBSCAN(DensityBased Spatial Clustering of Applications with Noise)聚类、信息熵与遗传算法的DIEGA(DBSCAN Information Entropy Genetic Algorithm)仿真标定改进方法;通过仿真实验分析交织区长度(L_(W))、驶入流量(Q_(RF))、驶出流量(Q_(FR))与通行能力的关联关系;同时,构建基于堆叠策略的通行能力估计模型,并结合SHAP(SHapley Additive Explanation)方法剖析各影响因素的作用机制。结果表明:DIEGA标定方法可将交织区各流向延误误差控制在3%以内,较传统遗传算法的收敛速度提升22.2%;在总交织流量相同的情况下,Q_(RF)与Q_(FR)的不同占比会导致通行能力在约15%范围内波动,且Q_(RF)、Q_(FR)与L_(W)之间存在非线性耦合关系;基于堆叠策略的随机森林机器学习(ML_(RF))模型(R^(2)=0.969)表现最佳,优于其他基线模型;SHAP分析显示,当Q_(RF)/Q_(FR)占比接近1,且L_(W)的范围为250~350 m时,可实现4635~4860 pcu·h^(-1)的峰值通行能力。 展开更多
关键词 交通工程 通行能力估计方法 交通仿真与机器学习 交织区 可解释性分析
在线阅读 下载PDF
融合XGBoost和SHAP的地表峰值加速度预测分析模型 被引量:8
15
作者 齐婉婉 孙锐 +1 位作者 郑桐 亓金磊 《岩土工程学报》 EI CAS CSCD 北大核心 2023年第9期1934-1943,共10页
为建立一种不依赖土体本构模型,只依靠地震动和场地主要特征的地表加速度峰值预测方法,以日本KiK-net强震台网搜集到的3104组基岩和地表地震动记录为基础,通过特征选择筛选出6个特征参数,以输入地震动加速度峰值和输入地震动卓越频率表... 为建立一种不依赖土体本构模型,只依靠地震动和场地主要特征的地表加速度峰值预测方法,以日本KiK-net强震台网搜集到的3104组基岩和地表地震动记录为基础,通过特征选择筛选出6个特征参数,以输入地震动加速度峰值和输入地震动卓越频率表征输入地震动特性,以剪切波速达800 m/s时的土层埋深、场地基本周期、基岩剪切波速和地表剪切波速表征场地特性。采用XGBoost模型,构建基于6个特征参数的地表峰值加速度(PGA)预测模型。通过对比实测记录和一维数值模拟计算结果,表明本文建立的XGBoost模型预测结果稳定,能较好的预测PGA,训练集和测试集的决定系数均大于0.925,平均绝对百分比误差均在20%左右。同时引入SHAP对输入特征与预测结果之间的影响和依赖性进行分析,增强了模型的可解释性,同时也为预测结果提供了可靠性支撑。 展开更多
关键词 机器学习 XGBoost PGA预测 shap 可解释性
在线阅读 下载PDF
基于XGboost的企业债务违约特征预警分析 被引量:1
16
作者 谭本艳 袁神鹏 《会计之友》 北大核心 2023年第19期74-81,共8页
债务违约会对企业的正常生产经营带来严重的负面影响。文章以我国2012—2021年上市公司的财务数据和非财务数据共38个指标作为研究对象,首先查询企业的债务诉讼和信用债违约情况以确定企业是否债务违约,采用XGboost机器学习算法构建企... 债务违约会对企业的正常生产经营带来严重的负面影响。文章以我国2012—2021年上市公司的财务数据和非财务数据共38个指标作为研究对象,首先查询企业的债务诉讼和信用债违约情况以确定企业是否债务违约,采用XGboost机器学习算法构建企业债务违约风险预警模型,实证结果显示,基于XGboost所构建的企业债务违约风险预警模型具有较好的预警效果。其次,将XGboost训练模型与决策树、随机森林、Light GBM、GBDT、Adaboost等多种机器学习模型进行稳健性比较,结果表明,XGboost模型在AUC、准确率、精确率、召回率、F1值等各项性能指标上均优于对比模型。再次,分别引入SHAP映射图和SHAP力图对模型进行了全局性和局部性解释,发现影响企业债务违约风险的因素不仅仅局限于企业的财务状况,企业的股权结构、公司治理也是重要影响因素,对企业开展债务违约风险控制具有指导意义。最后,给企业提出了相关的建议。 展开更多
关键词 上市公司 债务违约 XGboost shap解释方法 机器学习
在线阅读 下载PDF
基于XGBoost的二轮车碾压事故致因研究 被引量:4
17
作者 殷豪 林淼 +2 位作者 王鹏 魏雯 朱彤 《安全与环境工程》 CAS CSCD 北大核心 2023年第5期19-27,45,共10页
二轮车被卷入机动车底部并遭受碾压,会造成严重的事故伤害。为识别二轮车被卷入机动车底部的原因及其影响因素,以中国交通事故深度调查(CIDAS)数据库中2 627起二轮车与机动车碰撞事故案例为基础,根据数据分布特征采用合成少数过采样(SMO... 二轮车被卷入机动车底部并遭受碾压,会造成严重的事故伤害。为识别二轮车被卷入机动车底部的原因及其影响因素,以中国交通事故深度调查(CIDAS)数据库中2 627起二轮车与机动车碰撞事故案例为基础,根据数据分布特征采用合成少数过采样(SMOTE)技术形成平衡数据集以训练机器学习模型;经过对比7种机器学习模型的分类性能,选用XGBoost模型构建二轮车碾压事故预测模型,并基于多项指标进行交叉验证以验证模型的预测性能;最后采用SHAP可解释性方法进一步挖掘二轮车碾压事故致因。结果表明:二轮车碾压事故致死率超出非碾压事故25.3%;XGBoost模型的综合预测性能优于其余6种机器学习模型;在与事故相关的环境因素中,工业区和郊区以及弯道、交叉路口是二轮车碾压事故的高发地点;与碰撞场景相关的二轮车碾压事故高风险因素包括二轮车侧面或尾部碰撞以及二轮车较低车速;摩托车以及踏板式二轮车不易被四轮机动车碾压;此外,二轮车车身越小,四轮机动车越高、越长,越容易发生二轮车碾压事故。根据研究结果从车辆设计、交通管理角度提出了避免二轮车骑行者遭受四轮机动车碾压的建议,为事故精准防控提供了新的视角和信息。 展开更多
关键词 二轮车 碾压事故 致因 机器学习 XGBoost模型 shap可解释性方法 交通安全
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部