期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种可用于分类型属性数据的多变量决策树算法 被引量:19
1
作者 刘振宇 宋晓莹 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第11期1521-1527,共7页
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样... 针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构. 展开更多
关键词 决策树 分类型属性 多变量决策树 结点划分 K-均值
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部