-
题名基于模糊粗糙集的肿瘤分类特征基因选取
被引量:11
- 1
-
-
作者
徐菲菲
苗夺谦
魏莱
-
机构
同济大学计算机科学与技术系
同济大学嵌入式系统与服务计算教育部重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2009年第3期196-200,共5页
-
基金
国家自然科学基金项目(60475019)
国家自然科学基金重点项目(60534060)
+1 种基金
国家重点基础研究发展计划(973计划)(2003CB316902)
2006年博士学科点专项科研基金(20060247039)资助
-
文摘
依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类别的一组特征基因。粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因。由于基因表达谱数据集的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,尝试将模糊粗糙集应用于特征基因的选取,提出了基于互信息的模糊粗糙集属性约简算法,运用于基因表达谱数据集的基因选取。然后分别采用KNN和C5.0分类器进行特征基因分类性能进行检验。以急性白血病亚型(leukemia Microarray)和直肠癌(colon Microarray)分类特征基因选取为例进行实验,结果表明了上述方法的可行性和有效性。
-
关键词
基因表达谱数据集
特征选取
粗糙集
模糊粗糙集
互信息
-
Keywords
Gene expression data, Feature selection, Rough sets, Fuzzy rough sets, Mutual information
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于互信息的模糊粗糙分类特征基因快速选取方法
被引量:6
- 2
-
-
作者
徐菲菲
魏莱
杜海洲
王文欢
-
机构
上海电力学院计算机与信息工程学院
上海海事大学信息工程学院
上海电力学院能源与环境工程学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第7期216-221,235,共7页
-
基金
国家重点基础研究发展计划(973计划)子课题(2009CB219801)
上海市教育委员会科研创新项目(12YZ140)
+1 种基金
上海高校青年教师培养资助计划(sdl11003)
上海电力学院人才引进基金(K-2011-002)资助
-
文摘
依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的特征基因的分类精度造成一定影响。因此,曾提出基于互信息的模糊粗糙集基因表达谱数据集特征基因的选取算法。然而,该算法计算代价较高,当所选取的基因数较多时难以实现。为此,对该算法进行了改进,从最大相关性和最重要性(最小冗余)两方面对互信息进行了近似替代计算,大大降低了算法的复杂度,提高了算法的效率。以急性白血病亚型(leukemia)、直肠癌(colon)和乳腺癌(Breast)分类特征基因选取为例进行实验,然后分别采用1NN和SVM分类器进行特征基因分类精度检验,结果证实了新方法的可行性和有效性。
-
关键词
特征选取
模糊粗糙集
互信息
基因表达谱数据集
-
Keywords
Feature selection, Fuzzy rough sets, Mutual information, Gene expression data
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-