-
题名基于聚类和微粒群优化的基因选择方法
被引量:10
- 1
-
-
作者
刘金勇
郑恩辉
陆慧娟
-
机构
中国计量学院机电工程学院
中国计量学院信息科学学院
-
出处
《数据采集与处理》
CSCD
北大核心
2014年第1期83-89,共7页
-
基金
国家自然基金(60905034
61272315)资助项目
+1 种基金
浙江省自然基金(Y1080950
1110342)资助项目
-
文摘
在高维的基因表达谱数据中,只有少量基因对分类诊断其作用,而且还存在大量冗余的与癌症分类诊断无关的噪声基因,这些都会导致分类性能的下降。通过基因选择选取与分类紧密关联的基因,不仅能够剔除与疾病无关的基因,减少机器学习算法的时间复杂度和空间复杂度,提高分类的正确率,而且选出的特征基因可以作为肿瘤基因诊断和肿瘤药物治疗靶标确定的依据,降低后期生物学分析成本。本文提出一种基于聚类和粒子群算法(Particle swarm optimization,PSO)的基因选择方法,在PSO算法进行搜索之前,先对基因进行聚类,并对聚类结果进行选择,将被选中的簇的中心作为PSO的初始值,每个被选中的簇作为一个搜索空间,并利用极限学习机(Extreme learning machine,ELM)的分类精度作为特征选择的适应评价标准。该算法不仅有效地利用了聚类算法对基因进行初步归并的能力,也利用了PSO算法的全局优化能力,克服了传统PSO算法早熟、局部收敛速度慢的缺点,因此它能够高效地完成最优基因子集的确定,同时提高癌症分类正确率。
-
关键词
基因表达谱数据
基因选择
微粒群优化
极限学习机
-
Keywords
gene expression data
gene selection
particle swarm optimization
extreme learn-ing machine
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-