期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词出现和信息增益的连续属性离散化方法 被引量:2
1
作者 孙挺 耿国华 周明全 《计算机应用研究》 CSCD 北大核心 2009年第2期485-487,499,共4页
连续属性的离散化是文本分类任务中数据预处理阶段的一项重要技术。针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-interval discretization based on ... 连续属性的离散化是文本分类任务中数据预处理阶段的一项重要技术。针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-interval discretization based on term presence and information gain,MTPIG)。并将MTPIG算法应用到了分类算法AdaBoost.MH中,给出实验结果及分析。实验结果表明,使用MTPIG算法处理文本分类中的数据,其过程简单高效,预测精度高,可理解性强。采用该算法离散化数据集后,分类算法的分类性能有所提高。 展开更多
关键词 连续属性的离散化 信息增益 文本分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部