期刊文献+

基于随机森林和XGBoost算法的二手车价格预测 被引量:7

Prediction of Used Car Price Based on Random Forest and XGBoost
在线阅读 下载PDF
导出
摘要 为更好的预测二手车价格,根据二手车数据集,将随机森林和XGBoost算法相结合进行预测。首先对原始数据进行数据预处理,对奇异值与缺失值进行预处理以及数据的结构化处理。再利用随机森林算法进行变量选择,根据随机森林输出的得分排序选择分数不为零的变量作为预测价格的特征变量。再将XGBoost,GBDT和lightGBM三种算法进行网格搜索寻到最优参数,对比后选用XGBoost算法进行二手车价格预测得到最优的二手车价格预测结果。 In order to better predict the price of second-hand cars,according to the second-hand car data set,the random forest and XGBoost algorithm are combined to make predictions.First,the original data is preprocessed,singular values and missing values are preprocessed,and the data is structured.Then use the random forest algorithm for variable selection,and select the variable with a score that is not zero according to the score output of the random forest as the feature variable of the predicted price.The three algorithms of XGBoost,GBDT and lightGBM are searched to find the optimal parameters.After comparison,the XGBoost algorithm is selected to predict the used car price to obtain the optimal used car price prediction result.
作者 郑婕 ZHENG Jie(North China University of Technology,Beijing 100144)
机构地区 北方工业大学
出处 《数字技术与应用》 2021年第6期90-93,188,共5页 Digital Technology & Application
基金 北方工业大学毓优人才项目(107051360021XN083/058) 北方工业大学新教师科研启动经费(110051360002)。
关键词 二手车价预测 随机森林 网格搜索 XGBoost Used car price forecast Random Forest Grid Search XGBoost
作者简介 郑婕(1996-),女,山西忻州人,研究生,研究方向:应用统计。
  • 相关文献

参考文献7

二级参考文献143

  • 1李兵,韩睿,何怡刚,张晓艺,侯金波.改进随机森林算法在电机轴承故障诊断中的应用[J].中国电机工程学报,2020,40(4):1310-1319. 被引量:85
  • 2陈振宇,刘金波,李晨,季晓慧,李大鹏,黄运豪,狄方春,高兴宇,徐立中.基于LSTM与XGBoost组合模型的超短期电力负荷预测[J].电网技术,2020,44(2):614-620. 被引量:238
  • 3赵春霞,钱乐祥.遥感影像监督分类与非监督分类的比较[J].河南大学学报(自然科学版),2004,34(3):90-93. 被引量:89
  • 4王兴玲,李占斌.基于网格搜索的支持向量机核函数参数的确定[J].中国海洋大学学报(自然科学版),2005,35(5):859-862. 被引量:128
  • 5VAPNIK V, LEVIN E, CUN Y L. Measuring the VC-dimension of learning machines[J]. Neural Computation, 1994, 6(5): 851-876.
  • 6CHAPELLE O, VAPNIK V, BOUSQUET O. Choosing multiple parameters for support vector machines[J]. Machine Learning, 2002, 46(1/3): 131-159.
  • 7CHEN P W, WANG J Y, LEE H. Model selection of SVMs using GA approach[C]//Proc of 2004 IEEE Int Joint Conf on Neural Networks. Piscataway, USA, 2004: 2035-2040.
  • 8EBERHART R, KENNEY J. A new optimizer using particle swarm theory[C]//Proc of the sixth International Symposium on Micro Machine and Human Science. Piscataway, USA, 1995: 39-43.
  • 9SU C T, YANG C H. Feature selection for the SVM: an application to hypertension diagnosis[J]. Expert Systems with Application, 2008, 34(1): 754-763.
  • 10KEERTHI S S, LIN C J. Asymptotic behaviors of support vector machines with Gaussian kernel[J]. Neural Computation, 2003, 15(7): 1667-1689.

共引文献870

同被引文献36

引证文献7

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部