-
题名决策树ID3算法的分析与优化
被引量:16
- 1
-
-
作者
黄宇达
范太华
-
机构
西南科技大学计算机科学与技术学院
周口职业技术学院信息工程系
-
出处
《计算机工程与设计》
CSCD
北大核心
2012年第8期3089-3093,共5页
-
基金
河南省教育厅自然科学研究计划基金项目(2008B520047)
-
文摘
对ID3算法的基本原理及其主要不足以及现有几种改进算法的优缺点进行了简要分析,针对ID3算法的主要不足即倾向于多值属性的选取,利用粗糙集理论和数学相关知识点对其进行了一定程度的改进。理论分析和实验结果表明,改进后的算法在一定程度上不仅较好地解决了ID3算法的多值偏向问题而且大大简化了算法的计算过程,明显提高了算法分类准确度和执行效率。
-
关键词
决策树
ID3算法
信息熵
粗糙集
客观属性重要度
-
Keywords
decision tree
ID3 algorithm
information entropy
rough set
objective attribute importance
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于朴素贝叶斯与ID3算法的决策树分类
被引量:19
- 2
-
-
作者
黄宇达
王迤冉
-
机构
西南科技大学计算机科学与技术学院
周口职业技术学院信息工程系
周口师范学院计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
2012年第14期41-43,47,共4页
-
基金
河南省教育厅自然科学研究计划基金资助项目(2008B520047)
河南省科技厅基础与前沿技术研究计划基金资助项目(112300410307)
-
文摘
在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID3算法的多值偏向问题,并且具有较高的执行效率和分类准确度。
-
关键词
朴素贝叶斯算法
ID3算法
信息增益
客观属性重要度
条件独立性假设
加权独立信息熵
-
Keywords
naive Bayesian algorithm
ID3 algorithm
information gain
objective attribute importance
conditional independence assumption
weighted independent information entropy
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-