-
题名一种特征值区间划分的模型决策树加速算法
被引量:4
- 1
-
-
作者
高虹雷
门昌骞
王文剑
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第6期1136-1143,共8页
-
基金
国家自然科学基金项目(62076154,61673249,U1805263)资助
山西省国际科技合作重点研发计划项目(201903D421050)资助
山西省自然科学基金项目(201901D111030)资助.
-
文摘
目前对决策树(Decision Tree,DT)分类问题的相关研究已取得了很多成果,但仍存在一些问题,如决策树在寻找最优切分点时需要遍历特征的所有取值,当数据集规模较大时,递归构建决策树所需时间将会很长,因此在保证分类精度的前提下加速决策树的构建具有重要意义.本文首先根据数据的不同分布,给出两种特征值区间的分割方法,即等精度特征值区间划分和变精度特征值区间划分,然后计算各选定区间的基尼指数,寻找最优特征及最优切分点,最后递归生成模型决策树.实验表明,算法在构造决策树时可有效减小计算代价,在保证分类精度的同时加速决策树的构造,且在一定程度上能够避免过拟合现象的发生.
-
关键词
决策树
基尼指数
模型决策树
等精度特征值区间划分
变精度特征值区间划分
-
Keywords
decision tree
gini index
model decision tree
equal-precision feature value interval partition
variable-precision feature value interval partition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-