期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于统计相关系数的数据离散化方法 被引量:5
1
作者 解亚萍 《计算机应用》 CSCD 北大核心 2011年第5期1409-1412,共4页
很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化。提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类属性间的相互依赖,选取最佳断点。此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制... 很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化。提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类属性间的相互依赖,选取最佳断点。此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制数据的信息丢失。将所提方法在乳腺癌症诊断以及其他领域数据上进行了应用,实验结果表明,该方法显著地提高了See5决策树的分类学习精度。 展开更多
关键词 离散化 数据挖掘 类属性相互依赖 变精度粗糙集 决策树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部