期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
基于XGBoost的COPD患者肺癌发生预测模型的建立与评价
1
作者 杨靖 焦童 +4 位作者 董宇娇 姚晨雨 孔群钰 石婕 杨拴盈 《西安交通大学学报(医学版)》 北大核心 2025年第2期345-352,共8页
目的 利用慢性阻塞性肺疾病(COPD)患者的临床特征数据构建XGBoost预测模型,并评价预测模型对COPD患者肺癌发生风险早期预测的效能。方法 本研究为回顾性横断面研究,采用整群抽样的方法,对2018年1月1日至2022年12月31日在西安交通大学第... 目的 利用慢性阻塞性肺疾病(COPD)患者的临床特征数据构建XGBoost预测模型,并评价预测模型对COPD患者肺癌发生风险早期预测的效能。方法 本研究为回顾性横断面研究,采用整群抽样的方法,对2018年1月1日至2022年12月31日在西安交通大学第二附属医院住院的经临床确诊的COPD患者进行筛选,共收集4 008例有完整数据的患者。首先对各特征基线进行分析,再利用XGBoost构建COPD患者肺癌发生风险预测模型,并利用SHAP(SHapley Additive exPlanation)值对各特征重要性进行量化和归因;决策曲线分析(DCA)曲线评价临床应用价值。结果 使用28个变量构建COPD患者肺癌发生风险模型之后,按照变量重要性排序及临床经验,筛选8个变量,重新构建预测模型,模型效能在训练集和测试集中分别为0.948(0.938,0.958)、0.797(0.738,0.856)。SHAP图显示CEA、CA125、FIB、嗜酸性粒细胞、PLT、D-二聚体升高和TT缩短均会增加COPD患者肺癌发生风险,DCA曲线显示该预测模型具有临床应用价值,可以帮助医师做出更准确的预后预测和治疗决策。结论 基于XGBoost成功建立了预测模型,以特征子集实现了对COPD患者肺癌发生风险的早期预测。 展开更多
关键词 慢性阻塞性肺疾病(COPD) 危险性评估 预测模型 xgboost SHAP
在线阅读 下载PDF
中国农业新质生产力发展水平测度与影响因素分析——基于XGBoost模型的经验证据
2
作者 吴展 瞿廷鸿 《上海管理科学》 2025年第1期59-66,共8页
发展农业新质生产力对于推动我国农业现代化和实现农业强国战略目标发挥重要作用。为客观量化影响农业新质生产力水平关键因素的非线性效应与重要性,提出一种基于机器学习方法的农业新质生产力发展水平测度和分析框架。利用极端梯度提升... 发展农业新质生产力对于推动我国农业现代化和实现农业强国战略目标发挥重要作用。为客观量化影响农业新质生产力水平关键因素的非线性效应与重要性,提出一种基于机器学习方法的农业新质生产力发展水平测度和分析框架。利用极端梯度提升(XGBoost)算法、SHAP机器学习解释方法和TOPSIS模型测度和分析2012年至2022年中国农业新质生产力发展水平。此外,应用五折交叉验证对机器学习回归模型结果进行稳健性检验。最后采用SHAP模型深入分析影响我国农业新质生产力水平的关键驱动因素,探索促进我国农业新质生产力发展路径。研究结果表明:我国农业新质生产力水平整体呈上升趋势,但总体水平较低;科技创新人才、高新技术产业发展规模和数字经济发展水平是影响我国农业新质生产力发展水平的关键驱动因素,且具有显著的正向效应和非线性特征。 展开更多
关键词 机器学习 SHAP模型 xgboost算法 农业新质生产力 驱动因素
在线阅读 下载PDF
基于XGBoost算法的摇床分选指标预测研究
3
作者 何微 戴昊霖 陈雯 《矿冶工程》 北大核心 2025年第1期70-75,共6页
提出了一种基于极限梯度提升(XGBoost)算法的摇床分选指标预测方法。该方法通过颜色矩量化矿带的颜色特征,图像矩量化矿带的形态特征,灰度共生矩阵评价指标的对比度、同质性、相关性和ASM能量量化矿带的纹理特征,根据分选过程中矿带颜... 提出了一种基于极限梯度提升(XGBoost)算法的摇床分选指标预测方法。该方法通过颜色矩量化矿带的颜色特征,图像矩量化矿带的形态特征,灰度共生矩阵评价指标的对比度、同质性、相关性和ASM能量量化矿带的纹理特征,根据分选过程中矿带颜色、形态和纹理的变化有效提取摇床矿带特征;然后将图像特征作为输入、选矿指标作为输出,利用XGBoost算法筛选矿带特征并构建预测模型,训练模型并在测试集上预测精矿品位、回收率和精矿产率,实现对分选指标的准确预测。通过与决策树模型和随机森林模型的精矿品位、精矿产率和回收率预测结果对比,基于XGBoost算法的模型对精矿回收率、产率预测精度高。 展开更多
关键词 摇床 特征提取 品位预测 xgboost 特征选择 图像识别 智能控制 分选指标 预测模型 矿带
在线阅读 下载PDF
基于XGBoost和QRLSTM的新能源出力高精度预测方法
4
作者 汪涛 申少辉 +1 位作者 袁晓鹏 关英宇 《信息技术》 2025年第1期186-190,196,共6页
在开展新能源出力预测阶段,由于新能源自身具有波动性和间歇性,导致预测结果的可靠性难以得到保障。为此,提出基于XGBoost和QRLSTM的新能源出力高精度预测方法。采用极限梯度提升算法(EXtreme Gradient Boosting,XGBoost)建立新能源出... 在开展新能源出力预测阶段,由于新能源自身具有波动性和间歇性,导致预测结果的可靠性难以得到保障。为此,提出基于XGBoost和QRLSTM的新能源出力高精度预测方法。采用极限梯度提升算法(EXtreme Gradient Boosting,XGBoost)建立新能源出力数据的目标函数,利用二阶泰勒展开式对目标函数进行近似处理。结合分位数回归构(Quantile Regression,QR)改进长短期记忆(Long Short Term Memory,LSTM)递归神经网络,构建QRLSTM模型将近似处理后的数据输入至该模型中,通过逻辑门完成新能源出力预测。在测试结果中,实际方法在不同环境条件下对于新能源机组出力情况的预测结果均与实际情况保持较高的拟合度,具有较高的精准度。 展开更多
关键词 CART回归树 xgboost算法 二阶泰勒 分位数回归构 QRLSTM模型
在线阅读 下载PDF
基于RUN-XGBoost算法的土石坝渗流预测模型 被引量:2
5
作者 马春辉 侯媛媛 +2 位作者 杨杰 袁帅 徐笑颜 《水利水电科技进展》 CSCD 北大核心 2024年第2期72-78,共7页
针对传统土石坝渗流预测模型存在局部最优、抗干扰性差和预测精度低等问题,通过RUN算法优化XGBoost算法得到RUN-XGBoost算法,构建了RUN-XGBoost模型以获得更优的土石坝渗流预测结果。该模型在种群初始化时采用RUN算法对XGBoost算法的3... 针对传统土石坝渗流预测模型存在局部最优、抗干扰性差和预测精度低等问题,通过RUN算法优化XGBoost算法得到RUN-XGBoost算法,构建了RUN-XGBoost模型以获得更优的土石坝渗流预测结果。该模型在种群初始化时采用RUN算法对XGBoost算法的3个主要参数进行改进,使预测结果有较高的有效性;通过自动寻找最优参数增进算法的整体收敛速度和预测精度,同时引入随机解,使算法能够排除局部最小值并继续搜索,从而获得全局最优结果。工程实例验证结果表明,RUN-XGBoost模型具有简洁、高效、预测精度高、鲁棒性强等优点。 展开更多
关键词 土石坝 渗流监测 RUN-xgboost算法 预测模型
在线阅读 下载PDF
基于XGBOOST-SHAP的地铁建成环境与站点出行距离的非线性关系研究 被引量:6
6
作者 李培坤 陈旭梅 +3 位作者 鲁文博 马嘉欣 刘屹 王昊 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第4期1624-1633,共10页
相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境... 相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境、站点自身属性等方面构建11种建成环境指标,建立基于极端梯度提升的XGBOOST-SHAP归因分析架构的可解释性机器学习模型,以揭示两者之间的非线性关系。同时,将该模型拟合回归效果与梯度提升决策树(GBDT)及最小二乘回归(OLS)进行比较,以验证XGBOOST模型在拟合回归效果上的优势。结果表明:XGBOOST模型的R方、平均绝对误差(MAE)、均方误差(MSE)值分别为0.75、0.95、1.36,其拟合效果要优于GBDT与OLS模型。站点平均出行距离呈现出明显的环状分布的空间异质性。SHAP归因分析结果表明:距市中心距离特征贡献最大,路网密度、土地利用混合度、公交线路数量以及住宅数量对出行距离的贡献度也相对较高;POI香农熵指数、餐饮服务点对平均出行距离的正负反馈不明显;其余指标对平均出行距离的影响均呈现出正负反馈机制结合的趋势。研究结果对交通需求分析、线路容量优化、运营效果评估等提供了数据支撑,可有效提高地铁交通便利性,满足不同区域的出行需求并改善整个地铁系统的效率和可持续性。 展开更多
关键词 地铁站点 建成环境 出行距离 xgboost模型 SHAP归因分析 非线性关系
在线阅读 下载PDF
基于XGBoost算法的人—虎共存区域风险等级划分
7
作者 曲智林 桂宁晨 《沈阳大学学报(自然科学版)》 CAS 2024年第3期262-266,F0003,共6页
以2014—2019年珲春地区红外相机拍摄的东北虎数据为基础,基于XGBoost算法构建了虎出没区域风险等级划分模型。由模型检验可知:模型的准确率为93.51%,精确率为93.85%,召回率为93.08%,F1值为93.31%,Cohen s Kappa统计系数为90.2%。研究... 以2014—2019年珲春地区红外相机拍摄的东北虎数据为基础,基于XGBoost算法构建了虎出没区域风险等级划分模型。由模型检验可知:模型的准确率为93.51%,精确率为93.85%,召回率为93.08%,F1值为93.31%,Cohen s Kappa统计系数为90.2%。研究结果表明:基于XGBoost算法构建的人-虎共存区域风险等级划分模型分类效果好、预测准确度高,运用该模型对人-虎共存区域进行风险等级划分是可行的。 展开更多
关键词 人-虎共存区域 xgboost算法 风险等级 划分模型 红外相机陷阱
在线阅读 下载PDF
基于DE-XGBoost的短期风电功率预测 被引量:1
8
作者 张健 田海 《信息技术》 2024年第7期136-142,共7页
风电功率预测可为电力系统安全稳定运行提供重要的决策参考,因此研究如何提高风电功率预测精度具有重要意义。针对短期风电功率预测精度的问题,提出一种基于差分进化算法(DE)优化极端梯度提升树的组合预测模型(DE-XGBoost)。利用收敛速... 风电功率预测可为电力系统安全稳定运行提供重要的决策参考,因此研究如何提高风电功率预测精度具有重要意义。针对短期风电功率预测精度的问题,提出一种基于差分进化算法(DE)优化极端梯度提升树的组合预测模型(DE-XGBoost)。利用收敛速度快、优化效果好、复杂性低的差分进化算法对XGBoost的模型参数进行优化,实现对风电功率的准确预测。仿真结果证明,与其他预测模型相比,DE-XGBoost模型预测精度更高,泛化能力更强,可为风电调度运行提供详实的数据。 展开更多
关键词 风电功率预测 预测精度 差分进化算法 极端梯度提升树 组合模型
在线阅读 下载PDF
冶金机理与贝叶斯优化XGBoost融合的VD炉精炼终点钢液温度预测
9
作者 徐吉 信自成 +3 位作者 兰模 林文辉 张波 刘青 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第6期63-72,共10页
在炼钢生产过程中,真空脱气精炼(VD)炉是生产高品质钢的重要设备之一,其精炼终点温度对钢液质量、生产效率和连铸顺行具有重要影响。为了实现对VD炉精炼终点钢液温度的精准控制,本文采用冶金机理和贝叶斯优化极端梯度提升(metallurgical... 在炼钢生产过程中,真空脱气精炼(VD)炉是生产高品质钢的重要设备之一,其精炼终点温度对钢液质量、生产效率和连铸顺行具有重要影响。为了实现对VD炉精炼终点钢液温度的精准控制,本文采用冶金机理和贝叶斯优化极端梯度提升(metallurgical mechanism–Bayesian optimization–extreme gradient boosting,MM–BO–XGBoost)相结合的方法建立钢液温度预测模型。首先,基于VD炉冶金机理解析,确定影响精炼终点钢液温度的主要因素;其次,使用3σ原则对实际生产数据进行预处理,剔除异常值,并采用皮尔逊相关性分析剔除对钢液温度影响较小的因素,从而确定模型的输入变量;再次,将冶金机理与XGBoost模型进行融合,对输入变量的初始特征重要性进行部分放大;最后,针对XGBoost模型的超参数寻优问题,采用贝叶斯优化(BO)对其进行超参数寻优,由此构建了MM–BO–XGBoost模型。在模型仿真过程中,对本文模型同时使用网格搜索和随机搜索进行超参数寻优,旨在对比和验证BO寻优的效果;此外,使用本文提供的数据对已有的冶金机理模型、多元线性回归模型和反向传播神经网络模型进行仿真,并与MM–BO–XGBoost模型进行性能对比。结果表明:本文提出的MM–BO–XGBoost模型的超参数优化效果最好;本文模型的预测VD炉终点钢液温度在±10℃和±15℃误差范围内的命中率分别为87.81%和96.42%,均高于其他对比模型,综合性能最优。本文构建的VD炉钢液精炼终点温度预测模型,对实现钢液温度精准控制、降低生产成本和提高VD炉精炼效率具有重要的现实意义。 展开更多
关键词 VD炉精炼 钢液温度预测 机理分析 MM–BO–xgboost模型
在线阅读 下载PDF
Forecasting Method of Stock Market Volatility in Time Series Data Based on Mixed Model of ARIMA and XGBoost 被引量:16
10
作者 Yan Wang Yuankai Guo 《China Communications》 SCIE CSCD 2020年第3期205-221,共17页
Stock price forecasting is an important issue and interesting topic in financial markets.Because reasonable and accurate forecasts have the potential to generate high economic benefits,many researchers have been invol... Stock price forecasting is an important issue and interesting topic in financial markets.Because reasonable and accurate forecasts have the potential to generate high economic benefits,many researchers have been involved in the study of stock price forecasts.In this paper,the DWT-ARIMAGSXGB hybrid model is proposed.Firstly,the discrete wavelet transform is used to split the data set into approximation and error parts.Then the ARIMA(0,1,1),ARIMA(1,1,0),ARIMA(2,1,1)and ARIMA(3,1,0)models respectively process approximate partial data and the improved xgboost model(GSXGB)handles error partial data.Finally,the prediction results are combined using wavelet reconstruction.According to the experimental comparison of 10 stock data sets,it is found that the errors of DWT-ARIMA-GSXGB model are less than the four prediction models of ARIMA,XGBoost,GSXGB and DWT-ARIMA-XGBoost.The simulation results show that the DWT-ARIMA-GSXGB stock price prediction model has good approximation ability and generalization ability,and can fit the stock index opening price well.And the proposed model is considered to greatly improve the predictive performance of a single ARIMA model or a single XGBoost model in predicting stock prices. 展开更多
关键词 hybrid model discrete WAVELET TRANSFORM ARIMA xgboost grid search STOCK PRICE FORECAST
在线阅读 下载PDF
基于XGBoost模型的中小企业财务危机风险预测方法
11
作者 李瑾 《佳木斯大学学报(自然科学版)》 CAS 2024年第7期127-130,共4页
为提高中小企业财务危机风险预测精度,提高预测性能,引入XGBoost模型,开展中小企业财务危机风险预测方法设计研究。建立中小企业财务危机预警指标体系,包含盈利能力、营运能力等一级指标和营业利润率、净资产收益率等二级指标。针对指... 为提高中小企业财务危机风险预测精度,提高预测性能,引入XGBoost模型,开展中小企业财务危机风险预测方法设计研究。建立中小企业财务危机预警指标体系,包含盈利能力、营运能力等一级指标和营业利润率、净资产收益率等二级指标。针对指标变量相关性和重叠性的问题,引入主成分分析方法,对数据处理。利用XGBoost,构建财务危机预测模型,实现风险预测。通过对比实验证明,新的预测方法预测结果ROC曲线更趋近于左上,说明预测性能得到显著提升。 展开更多
关键词 xgboost模型 财务 风险预测 危机 中小企业
在线阅读 下载PDF
基于VMD-XGBoost-GRU模型的危岩体变形预测
12
作者 许秋鸿 刘晓青 《水利水电科技进展》 CSCD 北大核心 2024年第2期92-98,共7页
针对以往对危岩体监测数据前处理效果不佳的问题,提出了一种用于危岩体变形预测的VMD-XGBoost-GRU组合模型。该模型采用变分模态分解(VMD)和样本熵理论将危岩体变形数据分解成多个子序列,利用XGBoost算法提取重要的模型因子实现特征降维... 针对以往对危岩体监测数据前处理效果不佳的问题,提出了一种用于危岩体变形预测的VMD-XGBoost-GRU组合模型。该模型采用变分模态分解(VMD)和样本熵理论将危岩体变形数据分解成多个子序列,利用XGBoost算法提取重要的模型因子实现特征降维,通过门控循环单元(GRU)神经网络对危岩体变形进行预测。以某水电站右坝肩陡壁上的危岩体变形预测为例,将VMD-XGBoost-GRU组合模型与BP、GRU和VMD-XGBoost-BP 3种模型进行对比与分析,结果表明,VMD-XGBoost-GRU组合模型在危岩体变形预测方面具有较高精度,可为危岩体安全稳定状态评价提供技术依据。 展开更多
关键词 危岩体 VMD 样本熵 xgboost GRU 变形预测模型
在线阅读 下载PDF
基于XGBoost模型和立体时空网络的空铁联运方案优化研究
13
作者 白广栋 翁湦元 +2 位作者 朱建军 赵楠 王婧怡 《铁道运输与经济》 北大核心 2024年第10期125-132,141,共9页
空铁联运越来越受到旅客欢迎,空铁联运智能化方案推荐能够进一步满足旅客出行需求。研究提出一种基于XGBoost算法和立体时空网络的空铁联运方案推荐方法,分成整体方案推荐和具体方案推荐两阶段,联合实现空铁联运方案推荐。在整体方案推... 空铁联运越来越受到旅客欢迎,空铁联运智能化方案推荐能够进一步满足旅客出行需求。研究提出一种基于XGBoost算法和立体时空网络的空铁联运方案推荐方法,分成整体方案推荐和具体方案推荐两阶段,联合实现空铁联运方案推荐。在整体方案推荐阶段,首次实现了空铁联运运输方式的预测,并与空铁联运中转城市的预测巧妙结合,得到一个拟合效果好、准确率高的模型,在测试集合上准确率达到89.23%;空铁联运运输方式的预测,丰富了空铁联运方案推荐领域的研究方向。在具体方案推荐阶段,构建了一种考虑时间因素的立体时空网络,能够提供大量、准确、实时的信息,便于网络上的准确搜索和推荐策略的丰富设计;立体时空网络的实现,为空铁联运网络的研究增加了新的角度。 展开更多
关键词 空铁联运 机器学习 xgboost模型 中转城市推荐 运输方式推荐 立体时空网络
在线阅读 下载PDF
基于LSTM与XGBoost融合的养殖水质pH值预测方法研究
14
作者 郭方一 刘明剑 +3 位作者 王刚 张思佳 单渤林 刘通 《大连海洋大学学报》 CSCD 北大核心 2024年第6期1021-1031,共11页
为了确保水产养殖生态系统平衡及水生动物的健康,提出了一种融合长短期记忆网络(LSTM)和XGBoost算法的养殖水质pH值预测方法(PCA-ES-LSTM-BSO-XGBoost,PELBX)。首先,通过主成分分析(PCA)对水质数据进行降维处理,以简化参数复杂性并提高... 为了确保水产养殖生态系统平衡及水生动物的健康,提出了一种融合长短期记忆网络(LSTM)和XGBoost算法的养殖水质pH值预测方法(PCA-ES-LSTM-BSO-XGBoost,PELBX)。首先,通过主成分分析(PCA)对水质数据进行降维处理,以简化参数复杂性并提高模型训练的效率与精度;其次,利用LSTM网络捕获水质参数随时间的动态变化,并采用早停法避免过拟合,确保模型对未见数据具有较高的预测准确度;此外,通过BSO算法并行优化XGBoost模型的参数,提高pH值预测的精确度;最后,将LSTM与XGBoost模型的预测结果进行加权集成,有效结合了时间序列分析与非线性学习的优势,显著提高了预测准确度。结果表明,PELBX模型在pH值预测方面表现优越,具体表现为0.115的均方根误差、0.088的平均绝对误差、1.066%的平均绝对百分比误差,以及0.747的决定系数;相较于消融试验中表现最佳的PCA-LSTM-BSO-XGBoost模型,性能分别提升了8.73%、8.33%、8.26%和7.64%;与同领域中表现最好的BiLSTM-GRU预测模型相比,性能分别提升了10.16%、1.12%、0.56%和8.73%。研究表明,本研究中提出的PELBX模型在提升水质pH值预测的准确性和稳定性方面表现出明显的优势,验证了该方法的有效性和可行性。 展开更多
关键词 LSTM xgboost PCA PELBX模型 水质pH值预测
在线阅读 下载PDF
XGBoost模型与Logistic回归模型预测儿童TBTB合并MPP的价值
15
作者 刘小峰 洪智文 +2 位作者 陈芳 严灿 谢齐放 《华夏医学》 CAS 2024年第5期55-61,共7页
目的比较XGBoost模型和Logistic回归模型在预测儿童气管支气管结核(TBTB)合并肺炎支原体肺炎(MPP)中的效能。方法收集2018年6月至2023年1月入院治疗的212例MPP患儿临床资料,根据是否合并TBTB将其分为合并组(n=42)与肺炎组(n=170)。通过X... 目的比较XGBoost模型和Logistic回归模型在预测儿童气管支气管结核(TBTB)合并肺炎支原体肺炎(MPP)中的效能。方法收集2018年6月至2023年1月入院治疗的212例MPP患儿临床资料,根据是否合并TBTB将其分为合并组(n=42)与肺炎组(n=170)。通过XGBoost和Logistic回归构建儿童TBTB合并MPP的临床预测模型,采用受试者工作特征(ROC)曲线绘制两个模型在预测儿童TBTB合并MPP中的预测价值;采用Delong检验确定两个模型曲线下面积的差异。结果XGBoost模型筛选符合情况的相关变量为地区、咳嗽时间、发热史、咳嗽史、SIRI、WBC、湿罗音、SII,多因素Logistic回归分析发现,地区、发热史、咳嗽史、咳嗽时间、WBC是儿童TBTB合并MPP的独立危险因素(P<0.05),XGBoost曲线下面积为0.996,而Logistic回归模型曲线下面积仅为0.851。Delong检验发现,XGBoost模型预测效能高于Logistic回归模型,差异有统计学意义(P<0.01)。结论XGBoost模型优于Logistic回归模型,可作为诊断儿童TBTB合并MPP的有效工具。 展开更多
关键词 气管支气管结核 肺炎支原体肺炎 xgboost LOGISTIC回归 预测模型
在线阅读 下载PDF
基于RFM与XGBOOST模型融合的应用研究——以客户流失预测为例
16
作者 李佳镁 《中国高新科技》 2024年第19期54-57,共4页
文章提出将RFM模型客户价值分类结果作为特征融合机器学习算法的智能客户流失预测方法,并对其进行验证。首先,采用Pearson系数对特征进行相似度分析,以筛除冗余特征。其次,利用RFM价值分类模型,详细地对客户进行划分。最后,在XGBOOST算... 文章提出将RFM模型客户价值分类结果作为特征融合机器学习算法的智能客户流失预测方法,并对其进行验证。首先,采用Pearson系数对特征进行相似度分析,以筛除冗余特征。其次,利用RFM价值分类模型,详细地对客户进行划分。最后,在XGBOOST算法中叠用RFM价值分析模型分析结果,同时结合其他特征维度分析客户流失情况,以增强判断精度。案例通过对中国国内某企业客户数据的预测结果验证发现,优化后的机器学习模型比常规模型的预测结果准确性明显提高。另外,经过改进后的XGBOOST模型,比修改之前的预估准确性、召回成功率分别提高了3.1%、2.3%。 展开更多
关键词 客户价值分类 流失预警 xgboost算法 RFM模型
在线阅读 下载PDF
基于XGBoost改进模型的高速公路事故多发点鉴别及预测
17
作者 马飞虎 张玉玲 +2 位作者 宁玮 谢天长 王海玲 《交通运输研究》 2024年第3期66-74,共9页
为准确、快速地预测高速公路事故多发路段,获得事故时空数据的特征样本,明确事故的时空演化规律及关联机制,根据时空热点分析结果鉴别事故多发点的位置和时空演变模式,构建了GA-XGBoost事故多发点预测组合模型。首先,依据样本数据分别... 为准确、快速地预测高速公路事故多发路段,获得事故时空数据的特征样本,明确事故的时空演化规律及关联机制,根据时空热点分析结果鉴别事故多发点的位置和时空演变模式,构建了GA-XGBoost事故多发点预测组合模型。首先,依据样本数据分别构建年尺度、日尺度下的时空立方体,并进行热点分析,根据分析结果得到样本高速的事故多发点位置及其时空演化模式;经过比较分析和相关性检验,选取事故发生时间、里程、事件类型、处理时长、影响车道数、是否处于汇入口附近、是否节假日7项特征预测事故是否处于事故多发点。然后,分别使用CNN-LSTM、CNN-LSTM-ATT、随机森林、XGBoost模型4种算法对事故多发点进行预测,结果显示:相比其他3种,XGBoost模型的预测准确率最高。接着,采用遗传算法对XGBoost模型进行优化,构建了GA-XGBoost组合模型,使预测准确率提高0.06,F1分数提高0.07,精确率提高0.08。这表明,相比既有算法,GA-XGBoost模型能够较准确地预测出路段是否处于事故多发点,明确事故多发点事故的时空特征。最后,通过SHAP分析对预测结果进行解释,发现处于汇入口附近、事件类型为侧翻、故障、处于国庆假期和影响车道数为2的样本处于事故多发点的概率相比不处于汇入口附近和其他事故类型更大。据此,在交通安全和应急管理中可采取预防性措施,提升交通管理的效率和应急响应能力,营造安全、高效的交通环境。 展开更多
关键词 事故多发点 时空特征 事故鉴别与预测 xgboost 遗传算法 时空立方体模型 SHAP解释
在线阅读 下载PDF
LOO-XGboost模型预测岩石爆破块度 被引量:12
18
作者 叶海旺 胡俊杰 +3 位作者 雷涛 李宁 王其洲 DAHE MONYEGNI GHISLAIN 《爆破》 CSCD 北大核心 2022年第1期16-21,共6页
针对小样本条件下使用机器学习方法预测岩石爆破块度存在的数据利用率不足,预测精度存在浮动较大的问题。将留一法(LOO)与极限梯度提升(XGboost)算法结合,利用Python 3.7构建LOO-XGboost岩石爆破块度预测模型,选取31组爆破数据进行LOO-X... 针对小样本条件下使用机器学习方法预测岩石爆破块度存在的数据利用率不足,预测精度存在浮动较大的问题。将留一法(LOO)与极限梯度提升(XGboost)算法结合,利用Python 3.7构建LOO-XGboost岩石爆破块度预测模型,选取31组爆破数据进行LOO-XGboost模型训练与预测,通过调用不同参数,得到模型的最优内置参数如下:求解方式为树模型,学习率为0.30,决策树数量为50,决策树最大迭代深度为3,叶子节点最小样本数为3,随机采样比例为0.8。将预测结果与同条件下的支持向量机回归(SVR)、BP神经网络(BPNN)、随机森林(RF)模型以及10折交叉验证下的XGboost模型进行对比,对比结果为LOO-XGboost模型预测精度明显高于其他4种模型,其相关系数、均方根误差、平均绝对误差分别为0.9128、0.0587、0.0342。结果表明:LOO-XGboost模型既保证了小样本情况下的数据利用率,又提高了预测精度,适合应用于岩石爆破块度预测。 展开更多
关键词 岩石块度 LOO-xgboost模型 小样本预测 模型对比 Python 3.7
在线阅读 下载PDF
不同情景下LSTM及其变体模型的洪水模拟研究
19
作者 孟涵 姚成 +4 位作者 郑爱民 杨丰源 李京兵 石卓 张锦堂 《中国农村水利水电》 北大核心 2025年第2期114-120,128,共8页
长短期记忆网络(LSTM)模型能够有效地模拟降雨-径流间的非线性响应,在洪水模拟及预报中的应用日趋广泛。为了提高模型在不同应用场景下的适用性和模拟精度,基于LSTM模型及其5个变体模型,以皖南山区舒家流域1986-2000年30场洪水的降雨径... 长短期记忆网络(LSTM)模型能够有效地模拟降雨-径流间的非线性响应,在洪水模拟及预报中的应用日趋广泛。为了提高模型在不同应用场景下的适用性和模拟精度,基于LSTM模型及其5个变体模型,以皖南山区舒家流域1986-2000年30场洪水的降雨径流时间序列开展实例研究,探讨了包括不同损失函数、不同预见期以及不同训练规模等多种情景下,LSTM及其变体模型的洪水模拟效果;并开展了LSTM模型及其变体模型与极端梯度上升(XGBoost)模型的集合模拟研究。结果表明:(1)4种损失函数都能较好地实现舒家流域出口断面的洪水过程模拟,模拟精度:相对均方根误差(RSR)>纳什效率系数(NSE)>均方误差(MSE)>克林-古普塔效率系数(KGE),其中RSR在LSTM及其变体模型下测试集各场次的纳什效率系数(NSE)均能达到0.7以上。(2)随着预见期的延长,模型在处理长时间序列时面临信息遗忘或误差累积等问题,采用LSTM及其变体模型进行洪水模拟的精度总体呈下降趋势;相同的预见期情景下,随着训练规模的增加,模型模拟精度先上升达到最佳后趋于稳定。(3)LSTM模型及其变体模型与XGBoost模型进行模型集合,降低了单一模型的模拟偏差,使得整体预测更具准确性和可靠性;并且通过引入残差模拟,弥补了单一模型未能捕捉到的复式洪水的特征,进一步提高了复式洪水的模拟精度。 展开更多
关键词 LSTM模型 xgboost 模型集合 洪水模拟 舒家流域
在线阅读 下载PDF
一种基于Xgboost+GWR算法的中国地区降水量空间插值模型 被引量:4
20
作者 王浩钰 付国永 +1 位作者 李黎 仝涵琦 《水电能源科学》 北大核心 2021年第12期7-11,共5页
基于全国610个气象站点2020年实测降水资料,在综合考虑海陆位置、地形、归一化植被指数等物理协变量的基础上,构建Xgboost+GWR耦合模型分析了全国尺度上1 km分辨率降水量空间分布。结果表明,就全国尺度而言,站点降水数据具有强烈空间自... 基于全国610个气象站点2020年实测降水资料,在综合考虑海陆位置、地形、归一化植被指数等物理协变量的基础上,构建Xgboost+GWR耦合模型分析了全国尺度上1 km分辨率降水量空间分布。结果表明,就全国尺度而言,站点降水数据具有强烈空间自相关性,经纬度对降水量分布的影响是全局的,而地形和归一化植被指数的影响是局域的;Xgboost非线性预测耦合GWR外推残差模型弥补了单一Xgboost模型忽视降水数据空间自相关性的缺陷,模型验证精度R^(2)达0.96,M_(MAE)、R_(RMSE)分别为53.14、76.78 mm,相较于Xgboost模型R^(2)提升2.13%,M_(MAE)、R_(RMSE)分别减小16.84%、18.18%;2020年全国降水中心位于粤北、藏南、闽北与赣东交界地区,呈自北向南、自东向西地带性减少分布,南北方向的异质性强于东西方向。 展开更多
关键词 降水量 xgboost+GWR耦合模型 残差 空间插值
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部