摘要
综合Adaboost算法的自适应再加权和随机森林算法的未修剪随机变量划分树基模型,文章提出了用于自适应随机森林算法。通过实验数据发现,在训练集较大、贝叶斯误差较小时,模拟自适应再加权会起作用,从而,拟自适应随机森林算法会优于随机森林算法。
Combined adaptive reweight of Adaboost and not pruned classification tree by random input selected, the authors give a quasi - adaptive reweight random forest for classification. By experiment data, if train data is larger and Bayesian error is smaller, quasi - adaptive reweight may work, then quasi - adaptive random forest is prior to random forest in classification.
出处
《统计与信息论坛》
CSSCI
2010年第3期13-16,共4页
Journal of Statistics and Information
基金
全国统计科学研究计划项目"‘有指导’的电话调查技术--基于数据挖掘理念"(2008LY049)
教育部人文社会科学研究基金项目"预测建模中基于﹂﹁罚函数的规则化建模理论"(08JC910003)
作者简介
马景义(1979-),男,甘肃金昌人,博士后,硕士生导师,研究方向:数据挖掘;
谢邦昌(1962-),男,教授,湖南耒阳人,博士生导师,研究方向:调查与数据挖掘。