-
题名两种基因集分析方法的有效性比较
被引量:1
- 1
-
-
作者
曹文君
李运明
陈长生
-
机构
第四军医大学军事预防医学系卫生统计学教研室
山西省长治医学院基础部
-
出处
《中国卫生统计》
CSCD
北大核心
2009年第5期462-465,共4页
-
基金
国家自然科学基金资助项目(39900126)
陕西省科技计划项目(2008K04-02)
-
文摘
目的比较竞争性原假设χ2-Fisher’s精确概率法和自限性原假设SAM-GS方法作为基因集分析方法筛选富集基因集的效能,探讨两种方法的筛选效果。方法采用两种待比较的方法处理5种不同情景下的模拟数据,比较筛选结果与模拟设定的差异,计算相应的评价指标,探讨两种方法筛选富集基因集的效果。结果相同设定条件下,SAM-GS方法的筛选率均高于χ2-Fisher’s精确概率法。但推断结论相差不大,即当两组间均数相差较小(≤0.30)时,两种方法均不能较好地识别组间差异;相反,当两组均数差异足够大(>0.30)时,两种方法均能识别差异。结论SAM-GS方法略优于χ2-Fisher’s精确概率法,但两种方法均可用于基因表达谱筛选富集基因集的分析。χ2-Fisher’s精确概率法的优点是可用来分析解释变量为多分类变量的数据资料。
-
关键词
基因表达谱
基因集
SAM-GS
χ2-Fisher's精确检验
推断
-
Keywords
Gene Expression Profile
Gene set
SAM-GS
χ2-Fisher s Exact test
Inference
-
分类号
R195
[医药卫生—卫生统计学]
-
-
题名基因集分析方法统计理论探讨
- 2
-
-
作者
曹文君
侯国强
李运明
张威
张扬
陈长生
-
机构
山西省长治医学院基础部
山西省长治市妇幼保健医院
四川省成都军区总医院
第四军医大学军事预防医学院卫生统计学教研室
-
出处
《中国卫生统计》
CSCD
北大核心
2013年第4期484-486,共3页
-
基金
国家自然科学基金资助项目(81172770)
-
文摘
目的从统计理论角度探讨基因集分析方法,初步建立微阵列数据基因集统计分析理论框架。方法采用计算机模拟技术,比较不同原假设、理论分布生成方法在进行基因集分析时的统计学性质。结果自限性原假设方法ROC曲线下面积AUC为0.858。而竞争性原假设方法曲线下面积AUC为0.512。相同设定条件下,bootstrap方法的错误发现率(最高为0.015)低于permutation检验(最高为0.075);而permutation方法的检验效能(0.89)优于bootstrap法(0.67)。结论有效的基因集分析方法应在正确使用生物学注释基因的基础上,建立自限性原假设、采用基因表达水平标准化值构建基因集统计量并根据需求利用有效的随机化算法构建统计量的理论分布进行推断。
-
关键词
微阵列数据
基因集方法
统计理论
MONTE
CARLO模拟
-
Keywords
Microarray data
Gene set analysis method
Statistical theory
Monte Carlo simulation
-
分类号
R195
[医药卫生—卫生统计学]
-