摘要
计算机辅助医学诊断是机器学习技术的一个重要实践,但是在医学诊断中一个重要影响因素来自于数据集中的冗余特征。为了消除诊断中冗余特征对集成学习方法的精度的影响,文章提出了一种PCA-FS-Bagging算法,利用主成份分析进行特征变换来解决这个问题,算法在三个医学诊断数据集上与其它算法比如单个支持向量机、支持向量机Bagging集成等进行了性能比较,结果显示了PCA-FS-Bagging算法具有较好的性能。
Computer aided medical diagnosis is an important practice of machine learning techniques,but a critical factor reducing the accuracy of medical diagnosis is from the redundant features of medical data sets.In order to improve the diagnosis accuracy,PCA-FS-Bagging is proposed in this paper using principle component analysis to solve the redundant features.PCA-FS-Bagging is compared with single support vector machine,bagging of support vector machines on three real benchmark data sets.Experimental results show that PCA-FS-Bagging performs better than the other two algorithms do.
出处
《计算机工程与应用》
CSCD
北大核心
2006年第28期218-220,224,共4页
Computer Engineering and Applications
基金
南京大学计算机软件新技术国家重点实验室开放课题(7A05884)
上海教委E研究院-上海高校网格资助项目
关键词
集成学习
主成份分析
支持向量机
医学诊断
ensemble leaming,Principle Component Analysis,Support Vector Machines,medical diagnosis
作者简介
何鸣,硕士研究生,研究方向:集成学习,特征选择。李国正,博士,讲师,研究方向:机器学习,特征选择和数据挖掘。袁捷,副教授,研究方向:数据库,决策支持系统和软件工程。