摘要
为构造集成学习中具有差异性的基分类器,提出基于数据离散化的基分类器构造方法,并用于支持向量机集成。该方法采用粗糙集和布尔推理离散化算法处理训练样本集,能有效删除不相关和冗余的属性,提高基分类器的准确性和差异性。实验结果表明,所提方法能取得比传统集成学习算法Bagging和Adaboost更好的性能。
Construction method of base classifiers based on data discretizaion was proposed to produce individual classifiers with good diversity in ensemble learning. And then it was used in support vector machines ensemble. Using the rough sets and Boolean reasoning algorithm to process the training samples, this method can eliminate the irrelative and redundant attributes to improve the accuracy and diversity of base classifiers. Experimental results show that the presented method can achieve better performance than the traditional ensemble learning methods such as Bagging and Adaboost.
出处
《计算机应用》
CSCD
北大核心
2008年第8期2091-2093,共3页
journal of Computer Applications
基金
国家自然科学基金资助项目(60772163)
深圳市科技计划项目(SZKJ0708)
关键词
集成学习
基分类器
离散化
支持向量机集成
ensemble learning
base classifiers
discretization
Support Vector Machine (SVM) Ensemble
作者简介
蔡铁(1977-),男,湖南长沙人,讲师,博士,主要研究方向:信号处理、模式识别、语音处理与识别;cai. tie@ 163. com
伍星(1980-),女,湖南娄底人,讲师,硕士,主要研究方向:网络信息系统、信息安全;
李烨(1974-),男,湖南新化人,讲师,博士,主要研究方向:模式识别、机器学习。