期刊文献+
共找到192篇文章
< 1 2 10 >
每页显示 20 50 100
基于贝叶斯优化极端梯度提升树的电缆状态分类研究
1
作者 佘维 王欣 +3 位作者 陈斌 吕钟毓 张海丽 田钊 《郑州大学学报(理学版)》 北大核心 2025年第6期1-7,共7页
针对多分类问题中样本类间不均衡引起的电缆状态分类准确性不高的问题,提出一种基于贝叶斯优化极端梯度提升树的电缆状态分类方法。首先,利用贝叶斯优化对极端梯度提升树算法里面的超参数进行训练,获取最优超参数配置。其次,将最优超参... 针对多分类问题中样本类间不均衡引起的电缆状态分类准确性不高的问题,提出一种基于贝叶斯优化极端梯度提升树的电缆状态分类方法。首先,利用贝叶斯优化对极端梯度提升树算法里面的超参数进行训练,获取最优超参数配置。其次,将最优超参数配置应用于极端梯度提升树算法中,得到Bo-XGBoost分类模型。最后,通过实例验证该分类方法相较于SVM、TabNet、LightGBM等方法有更高的准确性,可为电缆状态分类提供一种新方向。 展开更多
关键词 贝叶斯优化 极端梯度提升 电缆状态分类 超参数优化
在线阅读 下载PDF
基于最大信息系数-双层置信极端梯度提升树的电网虚假数据注入攻击定位检测 被引量:2
2
作者 席磊 王文卓 +3 位作者 白芳岩 陈洪军 彭典名 李宗泽 《电网技术》 北大核心 2025年第2期824-833,I0112-I0114,共13页
面向高维复杂的电力量测数据,现有攻击定位检测方法存在定位精度差的问题。为此该文提出一种基于最大信息系数-双层置信极端梯度提升树的电网虚假数据注入攻击定位检测方法。所提方法引入最大信息系数对量测数据进行特征选择,能够非线... 面向高维复杂的电力量测数据,现有攻击定位检测方法存在定位精度差的问题。为此该文提出一种基于最大信息系数-双层置信极端梯度提升树的电网虚假数据注入攻击定位检测方法。所提方法引入最大信息系数对量测数据进行特征选择,能够非线性地衡量数据特征之间的关联性,且公平地根据一个特征变量中包含另一个特征变量的信息量来去除冗余特征,有效解决虚假数据注入攻击定位检测方法普遍面临的量测数据高维冗余问题;同时提出一种具有正反馈信息传递作用的双层置信极端梯度提升树来对各节点状态进行分类,通过结合电网拓扑关系学习标签相关性,从而有选择性地利用前序标签有效预测信息,来减少后续分类器学习到的前序标签预测信息中包含的错误,最终实现对受攻击位置的精确定位。在IEEE-14、IEEE-57节点系统上进行大量仿真,算例结果验证了所提方法的有效性,且相较于其他方法具有更高的准确率、精度、召回率、F1值和AUC(area under curve)值。 展开更多
关键词 虚假数据注入攻击 最大信息系数 双层置信 极端梯度提升 标签相关性
在线阅读 下载PDF
基于梯度提升回归树的三江源地区植被指数的预测方法研究
3
作者 张国晶 颜青松 +3 位作者 秦文强 张兹予 李希来 黄建强 《草地学报》 北大核心 2025年第5期1655-1668,共14页
为了揭示三江源地区2000—2023年植被时空变化格局及影响因素,并预测气候变化条件下三江源地区植被可能的变化趋势,本研究基于三江源达日、玛多、玉树、曲麻莱四个地区2000—2023年归一化植被指数(Normalized difference vegetation ind... 为了揭示三江源地区2000—2023年植被时空变化格局及影响因素,并预测气候变化条件下三江源地区植被可能的变化趋势,本研究基于三江源达日、玛多、玉树、曲麻莱四个地区2000—2023年归一化植被指数(Normalized difference vegetation index,NDVI)数据,以及温度、降水、风速和气压等气候数据进行分析。研究采用了梯度提升回归树、自适应增强回归、随机森林以及神经网络等机器学习算法建立NDVI预测模型。在此基础上,对所有模型参数进行了精细调优和验证,以提升模型性能和可靠性。最终,筛选出了模拟精度最优模型,进行多情景下植被变化模拟。研究结果表明,温度对NDVI的气象特征值占比最高,达0.6486。梯度提升回归模型在所有研究区综合表现优于其他模型,平均均方误差(Mean squared error,MSE)在0.00045~0.00104之间,拟合系数(Coefficient of determination,R^(2))均超过0.90,显示出强大的拟合能力。梯度提升回归树在预测三江源地区NDVI方面具有较高的准确性和稳定性,并对NDVI数据具有良好拟合效果,为三江源地区NDVI预测提供了科学方法。研究结果有助于预警气候变化条件下植被退化的潜能,为气候变化背景下该区域植被生态保护提供科学依据。 展开更多
关键词 NDVI 机器学习 梯度提升回归 三江源地区
在线阅读 下载PDF
基于Bayes超参数优化梯度提升树的心脏病预测方法
4
作者 王海燕 焦增晨 +2 位作者 赵剑 安天博 鞠熠 《吉林大学学报(理学版)》 北大核心 2025年第2期472-478,共7页
针对传统机器学习算法在数据集Cleveland和Hungary上预测准确率低的问题,提出一种基于Bayes超参数优化梯度提升树的心脏病预测方法.首先,采用K-最近邻算法对数据集中的缺失值进行填补,用Min-Max标准化、One-Hot编码处理数据,并基于梯度... 针对传统机器学习算法在数据集Cleveland和Hungary上预测准确率低的问题,提出一种基于Bayes超参数优化梯度提升树的心脏病预测方法.首先,采用K-最近邻算法对数据集中的缺失值进行填补,用Min-Max标准化、One-Hot编码处理数据,并基于梯度提升树算法进行心脏病预测;其次,采用Bayes优化和十倍交叉验证的方式搜寻算法的最佳超参数组合.实验结果表明,优化后的梯度提升树算法在心脏病数据集Cleveland上预测准确率可达90.2%,在心脏病数据集Hungary上预测准确率可达81.4%,优于决策树、支持向量机、K-最近邻等传统机器学习方法,可辅助医生进行心脏病诊断. 展开更多
关键词 心脏病预测 K-最近邻算法 梯度提升 Bayes优化
在线阅读 下载PDF
基于卷积神经网络与轻量级梯度提升树组合模型的电力行业短期以电折碳方法
5
作者 曾金灿 何耿生 +3 位作者 李姚旺 杜尔顺 张宁 朱浩骏 《上海交通大学学报》 北大核心 2025年第6期746-757,共12页
电力行业是碳排放的重点控排行业,准确、实时的电力行业碳排放计量是支撑其降碳减排的基础.目前,电力行业的碳排放计量主要基于实测法或核算法,难以很好地兼顾低计量成本与实时计量能力.为此,充分考虑电力行业良好的电力数据基础,挖掘电... 电力行业是碳排放的重点控排行业,准确、实时的电力行业碳排放计量是支撑其降碳减排的基础.目前,电力行业的碳排放计量主要基于实测法或核算法,难以很好地兼顾低计量成本与实时计量能力.为此,充分考虑电力行业良好的电力数据基础,挖掘电-碳间的相关关系,以电力历史数据为基础,基于机器学习方法提出一种电力行业短期以电折碳方法,实时估算电力行业短期碳排放情况.该方法使用卷积神经网络进行特征提取,并采用轻量级梯度提升树算法开展基于特征提取值的碳排放测算.此外,为了提升模型的泛化能力和鲁棒性,在模型训练中采用K折交叉验证技术,在模型参数优化过程中采用网格搜索技术.最后,为了验证所提模型的有效性,对比所提模型和其他机器学习模型在同等数据集划分条件下分别基于日度数据集与小时数据集中进行训练的效果.结果表明:所提模型在效果评估和测算值与目标值分布分析中均优于其他模型,能够较好地反映电力行业的短期碳排放情况. 展开更多
关键词 以电折碳 卷积神经网络 轻量级梯度提升算法 碳排放 机器学习 组合模型
在线阅读 下载PDF
基于梯度提升树模型的坡耕地土壤水蚀模拟与分析 被引量:1
6
作者 李潼亮 赵梓鉴 +5 位作者 李斌斌 张风宝 郭正 何琪琳 何庆 杨明义 《水土保持学报》 CSCD 北大核心 2024年第3期54-63,共10页
[目的]针对黄土高原坡耕地土壤侵蚀过程复杂、人为干扰强烈且难以量化的特点,利用机器学习定量解析主要影响因素对坡耕地土壤水蚀的作用与贡献,模拟分析坡耕地土壤水蚀特征并探究其机理,为坡耕地土壤侵蚀的预报提供基础支撑。[方法]基... [目的]针对黄土高原坡耕地土壤侵蚀过程复杂、人为干扰强烈且难以量化的特点,利用机器学习定量解析主要影响因素对坡耕地土壤水蚀的作用与贡献,模拟分析坡耕地土壤水蚀特征并探究其机理,为坡耕地土壤侵蚀的预报提供基础支撑。[方法]基于黄土高原子洲试验站坡耕地小区1959—1969年产流产沙观测数据,精细化表征其影响因子,运用梯度提升树模型对侵蚀量和径流深的变化及其影响因素的贡献进行分析。[结果]数据集中次降雨侵蚀量(0~122.72 t/km^(2))、径流深(0.02~17.20 mm)、降雨历时(2~1410 min)及平均雨强(0.02~4.63 mm)属强变异,变异系数均>1,且多数变量呈右偏态;在相同训练集和测试集划分情况下,对侵蚀量模型预测精度(R^(2)=0.81)略优于径流深模型(R^(2)=0.80),但侵蚀量模型的层数(8层)大于径流深模型(5层),表明侵蚀机理相较径流机理更为复杂;通过梯度提升树模型与SHAP算法对自变量重要性进行排序发现,影响侵蚀模型与径流模型的自变量重要性不同。[结论]受特征提取的限制,在侵蚀量与径流深较小时预测结果不理想,未来研究应当通过引入更多自变量组合方式寻找更多相关变量以提高对侵蚀事件的预测。产流和产沙的主要影响因素存在差异,降水本身特征对产流过程起主要作用,侵蚀产沙过程中主要受到降水与地形相关自变量的共同影响。基于数据驱动,为揭示黄土高原坡耕地侵蚀机理提供参考,并为区域坡耕地土壤侵蚀防治提供科学依据。 展开更多
关键词 预报模型 梯度提升模型 坡耕地 黄土坡面
在线阅读 下载PDF
基于梯度提升机的中国陆地生态系统土壤异养呼吸预测
7
作者 张金文 王文龙 +4 位作者 倪荣雨 张彬梅 曾爱聪 郭福涛 苏漳文 《浙江农林大学学报》 北大核心 2025年第4期774-783,共10页
【目的】极限梯度提升树(XGBoost)与轻量级梯度提升机(LightGBM)模型在梯度提升决策树框架下各具优势,系统对比两者在土壤异养呼吸估算中的性能差异,有助于深入挖掘梯度提升机在生态系统碳通量预测中的潜力,并推动该类模型在大尺度碳循... 【目的】极限梯度提升树(XGBoost)与轻量级梯度提升机(LightGBM)模型在梯度提升决策树框架下各具优势,系统对比两者在土壤异养呼吸估算中的性能差异,有助于深入挖掘梯度提升机在生态系统碳通量预测中的潜力,并推动该类模型在大尺度碳循环模拟中的优化应用。【方法】基于全球土壤呼吸数据库(SRDB),构建了中国陆地生态系统的土壤异养呼吸及环境因子数据库,利用XGBoost和LightGBM 2种梯度提升机模型对2000—2023年中国陆地生态系统土壤异养呼吸进行估算与对比分析,并进一步探讨中国陆地生态系统土壤异养呼吸的空间分布趋势及其主要影响因素。【结果】①2个模型均展现出较高的预测精度(测试集决定系数均为0.91),XGBoost模型在训练集上表现出较强的拟合能力,LightGBM模型则在测试集上能够更好地控制误差。②在2000—2023年,XGBoost与LightGBM模型估算的中国陆地生态系统土壤异养呼吸年平均值分别为299.57和294.60 g·m^(−2)·a^(−1),年际变化幅度分别为19.51和32.43 g·m^(−2)·a^(−1)。③中国陆地生态系统土壤异养呼吸呈现南高北低的空间分布特征,主要受土壤性质和叶面积指数影响。这一空间异质性反映了土壤异养呼吸对环境变化的不同响应。【结论】梯度提升机模型在大尺度土壤异养呼吸建模与预测中表现出良好的适应性,能够有效捕捉土壤异养呼吸的时空变化特征,展现出较强的预测能力. 展开更多
关键词 土壤异养呼吸估算 陆地生态系统 极限梯度提升(XGBoost)模型 轻量级梯度提升机(LightGBM)模型
在线阅读 下载PDF
基于优化负样本采样策略的梯度提升决策树与随机森林的汶川同震滑坡易发性评价 被引量:26
8
作者 郭衍昊 窦杰 +3 位作者 向子林 马豪 董傲男 罗万祺 《地质科技通报》 CAS CSCD 北大核心 2024年第3期251-265,共15页
强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模... 强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模型提高评价精度的对比研究仍需进一步研究。以山区汶川地震诱发的滑坡为研究区,首先选取地形地貌、地质环境、地震参数等10个滑坡评价因子,分析滑坡空间分布规律;其次因子共线性分析检验数据冗余,接下来采用频率比法(FR)选取极低、低易发区滑坡负样本点的采样策略;最后采用基于决策树演化改进的梯度提升决策树(GBDT)、随机森林(RF)和耦合模型(FR-GBD与FR-RF),开展了基于机器学习的同震滑坡易发性区划并进行精度评价。研究结果表明:①滑坡空间分布受到多层级因子控制;②模型预测精度为:FR-RF(AUC=0.943)>FR-GBDT(AUC=0.926)>RF(AUC=0.901)>GBDT(AUC=0.856);③在低易发区选择滑坡负样本可以明显提高易发性精度。研究成果可为滑坡易发性中负样本的选择和评价模型构建提供参考同时也为震后滑坡的防灾减灾提供理论支持。 展开更多
关键词 随机森林(RF) 梯度提升决策(gbdt) 机器学习 频率比法(FR) 采样策略 同震滑坡 滑坡易发性区划
在线阅读 下载PDF
基于梯度提升树的ALE图特征解释效果分析 被引量:1
9
作者 闵素芹 《统计与决策》 CSSCI 北大核心 2024年第3期57-62,共6页
理解特征效应有助于机器学习模型进行调优与预测结果解读,累积局部效应(ALE)图是一种独立于模型的黑盒预测特征解释新方法,文章基于梯度提升树分析其稳定性与解释效果。首先,推导输入特征服从联合高斯分布的累积局部效应与偏相关函数,... 理解特征效应有助于机器学习模型进行调优与预测结果解读,累积局部效应(ALE)图是一种独立于模型的黑盒预测特征解释新方法,文章基于梯度提升树分析其稳定性与解释效果。首先,推导输入特征服从联合高斯分布的累积局部效应与偏相关函数,分析特征间相关性的影响;其次,对估计的稳定性与特征效应解释的效果进行模拟研究,并提出将纵坐标统一设置用于特征选择参考;最后,针对实际数据集给出ALE图的应用实例,并将特征解释结论与传统统计模型显著性分析进行对比。 展开更多
关键词 累积局部效应 ALE图 特征解释 偏相关 梯度提升
在线阅读 下载PDF
基于梯度提升决策树(GBDT)算法的南方洪涝灾害房屋倒损评估模型 被引量:8
10
作者 林森 郭桂祯 刘蓓蓓 《灾害学》 CSCD 北大核心 2020年第1期109-112,130,共5页
结合影响洪涝灾害损失的10个指标,利用国家减灾中心灾情库中案例作训练样本,建立了基于梯度提升决策树(GBDT)算法的南方洪涝灾害房屋倒损评估模型,可用于洪涝灾害房屋倒损的快速评估。最后,利用2016年7月上旬南方洪涝灾害案例进行了模... 结合影响洪涝灾害损失的10个指标,利用国家减灾中心灾情库中案例作训练样本,建立了基于梯度提升决策树(GBDT)算法的南方洪涝灾害房屋倒损评估模型,可用于洪涝灾害房屋倒损的快速评估。最后,利用2016年7月上旬南方洪涝灾害案例进行了模型验证,总体相对误差为17.9%,证明该模型具有较高的可靠性,能够较好反映洪涝损失总体情况。 展开更多
关键词 洪涝灾害 房屋倒损 梯度提升决策(gbdt) 损失评估
在线阅读 下载PDF
基于梯度提升树算法的夏玉米叶面积指数反演 被引量:31
11
作者 张宏鸣 刘雯 +3 位作者 韩文霆 刘全中 宋荣杰 侯贵河 《农业机械学报》 EI CAS CSCD 北大核心 2019年第5期251-259,共9页
为了快速、准确、大范围获取大田夏玉米的叶面积指数(Leaf area index,LAI),基于实地采集的夏玉米LAI和株高,结合同时期的无人机多光谱影像,选择与夏玉米LAI相关性较强的8种植被指数以及株高作为反演LAI的输入变量,采用梯度提升树(Gradi... 为了快速、准确、大范围获取大田夏玉米的叶面积指数(Leaf area index,LAI),基于实地采集的夏玉米LAI和株高,结合同时期的无人机多光谱影像,选择与夏玉米LAI相关性较强的8种植被指数以及株高作为反演LAI的输入变量,采用梯度提升树(Gradient boosting decision tree,GBDT)算法建立植被指数及株高与叶面积指数之间的预测模型,并与支持向量机(Support vector machine,SVM)和随机森林(Random forest,RF)算法建立的模型进行预测精度对比。结果表明,GBDT算法在3个样本组中的LAI预测值与实测值R^2分别为0. 571 0、0. 755 8、0. 644 1,均高于SVM算法(0. 547 2、0. 679 1、0. 616 8)和RF算法(0. 550 5、0. 697 3、0. 629 5);对应的RMSE分别为0. 002 7、0. 001 5、0. 001 6,均低于SVM算法(0. 211 7、0. 152 3、0. 159 7)和RF算法(0. 244 7、0. 214 7、0. 208 0)。该研究为快速准确的大田夏玉米LAI遥感监测提供了技术和方法。 展开更多
关键词 夏玉米 叶面积指数 多光谱 梯度提升 植被指数
在线阅读 下载PDF
采用梯度提升决策树的车辆换道融合决策模型 被引量:27
12
作者 徐兵 刘潇 +2 位作者 汪子扬 刘飞虎 梁军 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第6期1171-1181,共11页
车辆在执行换道行为时,由于受到较多环境因素影响,难以准确进行换道识别和预测.为解决这一问题,提出一种基于梯度提升决策树(GBDT)进行特征变换的融合换道决策模型,以仿真驾驶员在高速公路上自由换道时的决策行为.采用主体车辆与目标车... 车辆在执行换道行为时,由于受到较多环境因素影响,难以准确进行换道识别和预测.为解决这一问题,提出一种基于梯度提升决策树(GBDT)进行特征变换的融合换道决策模型,以仿真驾驶员在高速公路上自由换道时的决策行为.采用主体车辆与目标车道后车的碰撞时间tlag及车辆周围交通状态变量进行车辆换道行为的建模分析,在NGSIM数据集上对建立的融合换道决策模型进行参数标定和模型测试.实验结果表明:融合换道决策模型以95.45%的预测准确率超越支持向量机、随机森林和GBDT等单一的换道决策模型,获得了最突出的表现.变量分析结果表明:新引入的换道决策变量tlag对车辆换道行为具有重要影响.提出的融合换道决策模型能够进一步减少因换道决策误判而导致的交通事故. 展开更多
关键词 梯度提升决策(gbdt) 自由换道行为 NGSIM数据集 换道决策模型 碰撞时间
在线阅读 下载PDF
基于半监督高斯混合模型与梯度提升树的砂岩储层相控孔隙度预测 被引量:12
13
作者 魏国华 韩宏伟 +2 位作者 刘浩杰 李明轩 袁三一 《石油地球物理勘探》 EI CSCD 北大核心 2023年第1期46-55,共10页
孔隙度是一种描述储层物性特征的重要参数。考虑砂岩与泥岩的孔隙度存在明显差异,提出了一种基于半监督高斯混合模型与梯度提升树的相控孔隙度预测方法,以实现砂岩储层孔隙度的精细描述。首先利用少量具岩相标签的测井数据确定高斯混合... 孔隙度是一种描述储层物性特征的重要参数。考虑砂岩与泥岩的孔隙度存在明显差异,提出了一种基于半监督高斯混合模型与梯度提升树的相控孔隙度预测方法,以实现砂岩储层孔隙度的精细描述。首先利用少量具岩相标签的测井数据确定高斯混合模型的初始聚类中心及对应的岩相类别;其次利用大量无标签测井数据优化高斯混合模型,实现砂岩与泥岩的准确划分;再次基于地质认识将泥岩孔隙度解释为固定的极小值,从而后续只开展砂岩孔隙度预测;然后将测井曲线拟合方法导出的孔隙度先验信息和测井敏感属性作为梯度提升树算法的多元输入信息,通过学习统计性岩石物理关系建立砂岩孔隙度的计算模型;最终根据岩相结果将砂岩段与泥岩段的孔隙度进行组合得到相控孔隙度。D油田的18口井数据测试结果表明:半监督高斯混合模型的岩相分类效果优于K均值、支持向量机、随机森林等机器学习算法,2口盲井的岩相分类准确率达到94.5%;所构建方法对2口盲井预测的相控孔隙度结果与真实孔隙度具有较高的一致性,平均相关系数达0.805。 展开更多
关键词 相控孔隙度预测 岩相划分 半监督高斯混合模型 梯度提升 机器学习
在线阅读 下载PDF
融合随机森林和梯度提升树的入侵检测研究 被引量:53
14
作者 周杰英 贺鹏飞 +2 位作者 邱荣发 陈国 吴维刚 《软件学报》 EI CSCD 北大核心 2021年第10期3254-3265,共12页
网络入侵检测系统作为一种保护网络免受攻击的安全防御技术,在保障计算机系统和网络安全领域起着非常重要的作用.针对网络入侵检测中数据不平衡的多分类问题,机器学习已被广泛用于入侵检测,比传统方法更智能、更准确.对现有的网络入侵... 网络入侵检测系统作为一种保护网络免受攻击的安全防御技术,在保障计算机系统和网络安全领域起着非常重要的作用.针对网络入侵检测中数据不平衡的多分类问题,机器学习已被广泛用于入侵检测,比传统方法更智能、更准确.对现有的网络入侵检测多分类方法进行了改进研究,提出了一种融合随机森林模型进行特征转换、使用梯度提升决策树模型进行分类的入侵检测模型RF-GBDT,该模型主要分为特征选择、特征转换和分类器这3个部分.采用UNSW-NB15数据集对RF-GBDT模型进行了实验测试,与其他3种同领域的算法相比,RF-GBDT既缩短了训练时间,又具有较高的检测率和较低的误报率,在测试数据集上受试者工作特征曲线下的面积可达98.57%.RF-GBDT对于解决网络入侵检测数据不平衡的多分类问题具有较显著的优势,是一种切实可行的入侵检测方法. 展开更多
关键词 网络入侵检测 数据不平衡 随机森林 梯度提升 UNSW-NB15数据集
在线阅读 下载PDF
基于梯度提升回归树的城市道路行程时间预测 被引量:28
15
作者 龚越 罗小芹 +1 位作者 王殿海 杨少辉 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2018年第3期453-460,共8页
为了提高行程时间的预测精度,在考虑时间序列相关性的同时,分析相邻路段的空间相关性对于行程时间的影响,并提出基于梯度提升回归树模型的城市道路行程时间预测方法.对车牌识别设备获取的实际数据进行预处理,并提出相应的补全算法以解... 为了提高行程时间的预测精度,在考虑时间序列相关性的同时,分析相邻路段的空间相关性对于行程时间的影响,并提出基于梯度提升回归树模型的城市道路行程时间预测方法.对车牌识别设备获取的实际数据进行预处理,并提出相应的补全算法以解决数据缺失问题,建立完整的历史数据集.通过分析各影响因素与行程时间的相关性,构建特征向量.为了能更好地理解模型,通过梯度提升回归树模型输出各变量对于预测结果的重要度.利用实际数据对模型进行评估,预测行程时间的平均绝对误差百分比,约为10.0%.与SVM、ARIMA等方法相比,所提方法具有较高的精度. 展开更多
关键词 交通工程 短时交通流预测 梯度提升回归模型(GBRT) 城市道路行程时间 车牌识别数据
在线阅读 下载PDF
基于梯度提升回归树的短时交通流预测模型 被引量:24
16
作者 沈夏炯 张俊涛 韩道军 《计算机科学》 CSCD 北大核心 2018年第6期222-227,264,共7页
短时交通流预测是交通流建模的一个重要组成部分,在城市道路交通的管理和控制中起着重要的作用。然而,常见的时间序列模型(如ARIMA)、随机森林(RF)模型在交通流预测方面由于被构建模型产生的残差和输入变量所影响,其预测精度受到限制。... 短时交通流预测是交通流建模的一个重要组成部分,在城市道路交通的管理和控制中起着重要的作用。然而,常见的时间序列模型(如ARIMA)、随机森林(RF)模型在交通流预测方面由于被构建模型产生的残差和输入变量所影响,其预测精度受到限制。针对该问题,提出了一种基于梯度提升回归树的短时交通预测模型来预测交通速度。首先,模型引入Huber损失函数作为模型残差的处理方法;其次,在输入变量中考虑预测断面受到毗邻空间因素和时间因素相关性的影响。模型在训练过程中通过不断调整弱学习器的权重来纠正模型的残差,从而提高模型预测的精度。利用某城市快速路的交通速度数据进行实验,并使用MSE和MAPE等指标将本文模型与ARIMA模型和随机森林模型进行对比,结果表明,文中所提模型的预测精度最好,从而验证了模型在短时交通流预测方面的有效性。 展开更多
关键词 短时交通流预测 梯度提升回归 损失函数 时空相关性
在线阅读 下载PDF
计及用电模式的居民负荷梯度提升树分类识别方法 被引量:18
17
作者 王守相 刘天宇 《电力系统及其自动化学报》 CSCD 北大核心 2017年第9期27-33,共7页
居民负荷分类与识别是负荷监测与需求侧管理的研究基础。为了实现居民负荷用电模式的提取和识别,本文对负荷公共数据集运用主成分分析降维并聚类,提出了一种计及典型用电模式的梯度提升树负荷分类识别方法。首先对负荷公共数据集重采样... 居民负荷分类与识别是负荷监测与需求侧管理的研究基础。为了实现居民负荷用电模式的提取和识别,本文对负荷公共数据集运用主成分分析降维并聚类,提出了一种计及典型用电模式的梯度提升树负荷分类识别方法。首先对负荷公共数据集重采样并获得各类负荷能耗特征样本,归一化后通过主成分分析法降维得到特征的主成分。再通过改进K均值聚类法获得各类负荷的典型用电模式,训练梯度提升树并进行超参数优化,对测试集负荷类型进行识别。在公共数据集与实测数据上测试发现,该方法对于居民负荷分类识别有良好效果,能够实现对负荷的分类识别。 展开更多
关键词 公共数据集 负荷用电模式 改进K均值聚类 梯度提升
在线阅读 下载PDF
基于梯度提升树模型的网络优惠券使用预测 被引量:6
18
作者 陆平 陈笑天 《科学技术与工程》 北大核心 2019年第18期234-238,共5页
互联网与实体经济融合发展背景下,网络优惠券往往承担了提升用户体验、促进再次消费的重要功能。构建梯度提升树、随机森林等模型,预测网络优惠券使用行为;并对影响因素的重要性进行排序。结果表明:梯度提升树算法的五折交叉验证平均测... 互联网与实体经济融合发展背景下,网络优惠券往往承担了提升用户体验、促进再次消费的重要功能。构建梯度提升树、随机森林等模型,预测网络优惠券使用行为;并对影响因素的重要性进行排序。结果表明:梯度提升树算法的五折交叉验证平均测试精度、曲线下面积值分别为 0. 804 与 0. 886,高于随机森林与单棵决策树算法。优惠券折扣率对于用户使用优惠券行为起着决定性影响,用户经常活动的地点离该商户最近门店的距离、领取优惠券时间等特征对用户使用优惠券行为具有重要影响。 展开更多
关键词 网络优惠券 梯度提升 随机森林 预测
在线阅读 下载PDF
基于梯度提升树的河南小麦成本收益分析 被引量:1
19
作者 温建 曾一鸣 +2 位作者 夏枫苒 汪松玉 雷丽娟 《江西农业学报》 CAS 2022年第12期204-210,共7页
基于2006—2020年河南省小麦生产数据,运用梯度提升树算法和文献分析法,分析了河南省小麦生产过程中成本和收益关系。结果表明:(1)2009—2019年的河南省小麦平均种植面积约占全国的23%,平均产量约占全国的27%。(2)通过对小麦生产过程中... 基于2006—2020年河南省小麦生产数据,运用梯度提升树算法和文献分析法,分析了河南省小麦生产过程中成本和收益关系。结果表明:(1)2009—2019年的河南省小麦平均种植面积约占全国的23%,平均产量约占全国的27%。(2)通过对小麦生产过程中的总成本、总产值、净利润、成本利润率以及平均售价进行分析发现,2016—2020年小麦的净利润情况不容乐观,大部分为负值。(3)气候不适、病虫害等自然原因大幅增加了小麦生产的成本。(4)梯度提升树模型的结果显示,在影响小麦生产成本的因子中,人工成本占比最大。综上,提出了降低河南省小麦生产成本和提高其经济效益的建议和对策,即改善投入结构、规模化种植、依靠科技、降低生产成本、政府加大支持和投入力度。 展开更多
关键词 梯度提升算法 小麦 成本收益 河南省
在线阅读 下载PDF
基于梯度提升回归树的有机污染物生物-沉积物积累因子预测模型 被引量:1
20
作者 王如冰 蔡喜运 《生态毒理学报》 CAS CSCD 北大核心 2023年第4期22-33,共12页
生物-沉积物积累因子(BSAF)是评价底栖无脊椎生物对有机污染物生物积累能力的重要参数,是由化合物、底栖环境与无脊椎生物之间的三相作用决定的。现有模型通常采用线性算法研究化合物BSAF与化合物理化性质的关系,忽略了由于环境-生物-... 生物-沉积物积累因子(BSAF)是评价底栖无脊椎生物对有机污染物生物积累能力的重要参数,是由化合物、底栖环境与无脊椎生物之间的三相作用决定的。现有模型通常采用线性算法研究化合物BSAF与化合物理化性质的关系,忽略了由于环境-生物-化合物相互作用引发的非线性影响,导致线性模型拟合和预测能力有限。本研究基于理化性质(PCP)和分子指纹(ECFP)描述化合物特征,结合环境样点和生物特征,采用梯度提升回归树(GBRT)的非线性算法,分别构建了底栖生物体内积累因子的GBRT-PCP和GBRT-ECFP预测模型,并与利用岭回归算法构建的线性模型进行比较。结果表明,GBRT模型训练集决定系数(R 2)均为0.97,验证集R 2为0.82~0.83,表明GBRT模型的拟合优度和预测能力显著优于岭回归模型(训练集和验证集R 2分别为0.38~0.56和0.38~0.52)。沉积物有机碳含量对生物-沉积物积累因子的影响呈波动下降趋势,脂质含量呈先波动上升而后下降趋势。GBRT-PCP模型结果表明,化合物疏水性(log K_(OW))对生物积累影响呈先平稳后上升而后下降趋势,吸附性(log K_(OC))对生物积累呈波动下降趋势。总体上,具有中等log K_(OW)(6.8~8.2)和中等log K_(OC)(4.4~5.2)的化合物易于积累在生物组织。GBRT-ECFP模型阐明了稠环、芳香环、醚键、C—Br键、联苯键等结构是影响生物积累的关键子结构,该模型基于分子指纹结构可实现对化学品生物积累的高通量预测。本研究建立的模型为化学品生态风险评价和管理决策制定提供理论依据和方法参考。 展开更多
关键词 有机污染物 底栖无脊椎生物 生物-沉积物积累因子 梯度提升回归
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部