期刊文献+

医学诊断中集成学习技术的研究 被引量:5

A Study on Ensemble Methods for Medical Diagnosis
在线阅读 下载PDF
导出
摘要 计算机辅助医学诊断是机器学习技术的一个重要实践,但是在医学诊断中一个重要影响因素来自于数据集中的冗余特征。为了消除诊断中冗余特征对集成学习方法的精度的影响,文章提出了一种PCA-FS-Bagging算法,利用主成份分析进行特征变换来解决这个问题,算法在三个医学诊断数据集上与其它算法比如单个支持向量机、支持向量机Bagging集成等进行了性能比较,结果显示了PCA-FS-Bagging算法具有较好的性能。 Computer aided medical diagnosis is an important practice of machine learning techniques,but a critical factor reducing the accuracy of medical diagnosis is from the redundant features of medical data sets.In order to improve the diagnosis accuracy,PCA-FS-Bagging is proposed in this paper using principle component analysis to solve the redundant features.PCA-FS-Bagging is compared with single support vector machine,bagging of support vector machines on three real benchmark data sets.Experimental results show that PCA-FS-Bagging performs better than the other two algorithms do.
出处 《计算机工程与应用》 CSCD 北大核心 2006年第28期218-220,224,共4页 Computer Engineering and Applications
基金 南京大学计算机软件新技术国家重点实验室开放课题(7A05884) 上海教委E研究院-上海高校网格资助项目
关键词 集成学习 主成份分析 支持向量机 医学诊断 ensemble leaming,Principle Component Analysis,Support Vector Machines,medical diagnosis
作者简介 何鸣,硕士研究生,研究方向:集成学习,特征选择。李国正,博士,讲师,研究方向:机器学习,特征选择和数据挖掘。袁捷,副教授,研究方向:数据库,决策支持系统和软件工程。
  • 相关文献

参考文献11

  • 1Yu Lei,Liu Huan.Efficient feature selection via analysis of relevance and redundancy[J].Journal of Machine Learning Research,2004;5(10):1205~1224
  • 2Li Guo-Zheng,Yang Jie,Ye Chen-Zhou et al.Degree Prediction of Malignancy in Brain Glioma Using Support Vector Machines[J].Computers in Biology and Medicine,2005
  • 3Fukunaga K.Introduction to Statistical Pattern Recognition[M].2nd Edition,Academic Press,Inc,1990
  • 4杨丽明.基于SVM理论的一种新的数据分类方法[J].数学的实践与认识,2003,33(12):61-65. 被引量:25
  • 5李国正 王猛 增华军 译 NelloCristianini JohnShawe-Taylor著.支持向量机导论[M].北京:电子工业出版社,2004..
  • 6刘学军,陈松灿,彭宏京.基于支持向量机的计算机键盘用户身份验真[J].计算机研究与发展,2002,39(9):1082-1086. 被引量:26
  • 7Chen Nian-Yi,Lu Wen-Cong,Yang Jie et al.Support vector machines in Chemistry[M].Singapore:World Scientific Publishing Company,2004-09
  • 8Breiman L.Bagging predictors[J].Machine Learning,1996; 24 (2):123~140
  • 9周志华,陈世福.神经网络集成[J].计算机学报,2002,25(1):1-8. 被引量:248
  • 10Blake C,Keogh E,Merz C J.UCI repository of machine learning databases[R].Tech Rep,Department of Information and Computer Science,University of California,Irvine,CA,http://www.ics.uci.edu/mlearn/MLRepository.htm

二级参考文献6

共引文献373

同被引文献53

  • 1何鸣,李国正,袁捷,吴耿锋.基于主成份分析的Bagging集成学习方法[J].上海大学学报(自然科学版),2006,12(4):415-418. 被引量:9
  • 2虞凡,杨利英,覃征.异构集成学习中的观察学习机制研究(英文)[J].广西师范大学学报(自然科学版),2006,24(4):54-57. 被引量:3
  • 3李青,焦李成.利用集成支撑矢量机提高分类性能[J].西安电子科技大学学报,2007,34(1):68-70. 被引量:6
  • 4Hansen L K, Salamon P. Neural Network Ensembles [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1990, 12(10): 993-1001.
  • 5Li Ying, Jiang Jianmin. Combination of SVM Knowledge for Mierocalcification Detection in Digital Mammograms [C]// IDEAL 2004, LNCS 3177. Berlin: Springer, 2004: 359-365.
  • 6Lanckriet G. Learning the Kernel Matrix with Semi-definite Programmming[J]. Journal of Machine Learning Research, 2004(5) : 27-72.
  • 7Skyrpnyk I. DIMACS Technical Center. Feature Selection and Training Set Sampling for Ensemble Learning on Hetergeneous Data[R]. New Jersey: the State University of New Jersey, 2003.
  • 8Rose C, Turi D, Williams A, et al. Digital Database for Screening Mammography[DB/OL]. [1998-08-20]. http:// marathon, csee. usf. edu/Mammography/Database, html.
  • 9ELCAP Lab, Weill Medical College of Cornell University. ELCAP Public Lung Image Database [DB/OL]. [2003-12- 20]. http://www, via. cornell, edu/lungdb, html.
  • 10Schapire R E. The Strength of Weak Learnability[J]. Machine Learning, 1990, 5(2) :197-227.

引证文献5

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部