-
题名基于遗传算法的随机森林模型在特征基因筛选中的应用
被引量:6
- 1
-
-
作者
赵发林
张涛
李康
-
机构
杭州师范大学医学院健康管理系
山东大学公共卫生学院生物统计学系
哈尔滨医科大学卫生统计学教研室
-
出处
《中国卫生统计》
CSCD
北大核心
2016年第4期559-562,566,共5页
-
基金
浙江省自然科学基金项目(LQ12H26002)
杭州师范大学科研启动基金项目(2011QDL12)
-
文摘
目的探索基于遗传算法的随机森林模型在特征基因筛选中的效果和特点。方法通过本文构建的基于遗传算法的随机森林模型(GARF)对真实基因数据和模拟数据进行特征基因筛选,以筛选后基因进行判别分析,计算ROC曲线下面积AUC值,同时观察GARF方法对模拟实验中预设的差异基因排序结果。结果对真实基因数据和模拟数据的分析结果均显示,采用GARF方法筛选得到的特征基因建立判别模型能获得更好的分类效果,在模拟实验中与随机森林相比能将预设的差异基因排在更靠前的位置。结论 GARF方法能够有效地用于基因芯片数据特征基因筛选,在FDR控制上具备潜力,具有研究价值。
-
关键词
随机森林
遗传算法
特征基因筛选
-
Keywords
Random forest
Genetic algorithm
Feature selection
-
分类号
Q811.4
[生物学—生物工程]
-
-
题名模糊聚类法在动态设计组学数据趋势聚类中的应用
被引量:2
- 2
-
-
作者
王璐
张涛
刘佳
刘盈君
公晓云
薛付忠
-
机构
山东大学公共卫生学院生物统计学系
-
出处
《中国卫生统计》
CSCD
北大核心
2015年第1期2-5,9,共5页
-
基金
国家自然科学基金资助(81302514)
山东省自然科学基金(ZR2013HQ056)
-
文摘
目的探讨模糊C均值聚类方法(FCM)在动态设计组学数据不同动态趋势聚类中的应用。方法使用模糊C均值聚类方法,分别对模拟的动态数据和动态基因表达进行聚类,识别不同的变化模式。结果对模拟数据的分析显示,FCM可以准确地识别模拟设定的不同动态变化趋势,并将其聚为一类;同时,通过设定隶属度阈值我们可以避免对噪声变量的聚类。而对动态基因组表达数据的实例分析表明FCM可以有效地将具有相同表达模式的基因聚类,并且能给出类间关系。结论模糊C-均值聚类可以用于动态组学数据不同动态变化模式的聚类,帮助我们更有效地探索生物信息。
-
关键词
动态组学数据
模糊C均值聚类
-
Keywords
Dynamic Omics data
Fuzzy C-means cluster
-
分类号
O212
[理学—概率论与数理统计]
-