期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
缺失数据处理方法的比较研究 被引量:25
1
作者 刘鹏 雷蕾 张雪凤 《计算机科学》 CSCD 北大核心 2004年第10期155-156,174,共3页
数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯朴缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重... 数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯朴缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。 展开更多
关键词 信息增益 朴素贝叶斯分类器 模型 数据挖掘 决策树 数据集 医疗领域 医疗数据 保留 处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部