期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于功能模块组织癌细胞系基因表达谱的关联规则 被引量:1
1
作者 王晨光 郭政 +1 位作者 李霞 王健 《第三军医大学学报》 CAS CSCD 北大核心 2006年第13期1370-1373,共4页
目的提出一种在功能模块化水平上组织大量基因表达谱关联规则的新方法。方法以高频出现在关联规则后件中的基因为基础分类关联规则,再选择显著聚集前件基因的GO基因功能类作为功能模块关联规则的前件,获得功能模块表达关联规则。结果根... 目的提出一种在功能模块化水平上组织大量基因表达谱关联规则的新方法。方法以高频出现在关联规则后件中的基因为基础分类关联规则,再选择显著聚集前件基因的GO基因功能类作为功能模块关联规则的前件,获得功能模块表达关联规则。结果根据NC I60数据,发现了一些与癌症相关的基因及相应的基因功能模块表达关联规则。结论利用功能模块表达关联规则可以有效地挖掘疾病基因表达谱。 展开更多
关键词 基因芯片 关联规则 GENE ONTOLOGY 癌症
在线阅读 下载PDF
毒蕈乙酰胆碱受体亚型关系的研究 被引量:6
2
作者 于海龙 肖云 +2 位作者 艾静 李霞 宫滨生 《遗传》 CAS CSCD 北大核心 2007年第10期1280-1288,共9页
利用不同类型的生物学数据,运用生物信息学方法和策略,从分子进化、序列相似性、表达相关性以及蛋白互作4个层面对M受体亚型之间的关系进行了比较全面的研究。分析表明,从分子进化和序列相似性角度,毒蕈乙酰胆碱受体5种亚型可分为2个亚... 利用不同类型的生物学数据,运用生物信息学方法和策略,从分子进化、序列相似性、表达相关性以及蛋白互作4个层面对M受体亚型之间的关系进行了比较全面的研究。分析表明,从分子进化和序列相似性角度,毒蕈乙酰胆碱受体5种亚型可分为2个亚类,分别为M1、M3、M5亚类(第一亚类)与M2、M4亚类(第二亚类),每一亚类内部亚型之间进化距离相对较近,序列相似性较高。在表达层面发现第一亚类中受体亚型与第二亚类中受体亚型在某些组织中正表达相关,呈现共表达趋势。在互作层面发现两亚类之间受体亚型存在着间接互作的关系,呈现协同作用的现象。 展开更多
关键词 毒蕈乙酰胆碱受体 亚型 分子进化 表达相关性 蛋白质互作
在线阅读 下载PDF
安佳欣胶囊对抑郁症模型大鼠基因功能类表达影响的初步研究 被引量:12
3
作者 钟国才 李强 +7 位作者 柯尊洪 吕莹丽 郝晓峰 李崇前 杨达 王海敏 王栋 郭政 《中国神经精神疾病杂志》 CAS CSCD 北大核心 2007年第2期82-87,共6页
目的研究安佳欣胶囊对抑郁症模型大鼠基因功能类表达的影响。方法分析抑郁症大鼠模型组和安佳欣胶囊组各8例样本的基因表达谱数据,筛选差异表达基因。利用基因功能分类体系Gene Ontology中的生物学过程子树和细胞组分子树,寻找和分析显... 目的研究安佳欣胶囊对抑郁症模型大鼠基因功能类表达的影响。方法分析抑郁症大鼠模型组和安佳欣胶囊组各8例样本的基因表达谱数据,筛选差异表达基因。利用基因功能分类体系Gene Ontology中的生物学过程子树和细胞组分子树,寻找和分析显著聚集差异表达基因的复合功能类,从分子水平和基因功能模块水平探索安佳欣胶囊对抑郁症模型大鼠基因表达谱的影响。结果筛选出330个差异表达基因,并进一步识别了8个差异表达基因功能模块,主要涉及糖代谢、蛋白转运、谷氨酰胺代谢、凋亡诱导和神经发生。通过文献证实进一步发现了差异功能模块中7个可能与抑郁症发病相关的基因(Pfkm、Gpx1、Stx1a、Ninj2、Plp、Evl、Nrn1)在两组动物中差异表达。结论安佳欣胶囊可能增加抑郁症模型大鼠的单胺递质合成和释放,改善神经保护和神经发生功能,这些改变可能与安佳欣胶囊的抗抑郁作用有关。 展开更多
关键词 安佳欣胶囊 抑郁症 基因表达谱 GENE ONTOLOGY 基因功能
在线阅读 下载PDF
调控通路内基因表达的相关性分析 被引量:5
4
作者 李传星 李霞 +2 位作者 郭政 宫滨生 屠康 《遗传》 CAS CSCD 北大核心 2004年第6期929-933,共5页
从基因表达调控通路的角度分析了基因功能与基因表达之间的关系 ,利用 7套酿酒酵母基因芯片表达谱数据和通路数据库 (KEGG和CYGD)所提供的信息 ,应用我们研制的Genehub软件分析研究了同一基因表达调控通路内的基因在mRNA表达水平上的相... 从基因表达调控通路的角度分析了基因功能与基因表达之间的关系 ,利用 7套酿酒酵母基因芯片表达谱数据和通路数据库 (KEGG和CYGD)所提供的信息 ,应用我们研制的Genehub软件分析研究了同一基因表达调控通路内的基因在mRNA表达水平上的相关性 ,共涉及 16条通路 ,4 95个基因。通过Pearson相关系数和Spearman相关系数两种相似性测度的分析 ,发现有 94 % (15条 )的基因表达调控通路内的基因在大于等于 4套的表达谱数据中是共表达的 ,以上结果从基因表达调控通路的角度 。 展开更多
关键词 调控通路 基因芯片 相似性测度 酿酒酵母
在线阅读 下载PDF
基因功能预测问题中的样本不平衡处理 被引量:5
5
作者 朱明珠 郭政 +3 位作者 李霞 刘帅 李彦辉 高磊 《中国生物医学工程学报》 CAS CSCD 北大核心 2006年第2期158-162,177,共6页
应用机器学习进行分类是基因功能预测的一种重要手段。但是许多预测集中的阳性样本过少,会降低功能预测的效果。针对此问题,本研究对结合支持向量机(SVM)算法的几种常用非平衡数据分类方法进行实验比较,包括投票整合分类器和移动分类面... 应用机器学习进行分类是基因功能预测的一种重要手段。但是许多预测集中的阳性样本过少,会降低功能预测的效果。针对此问题,本研究对结合支持向量机(SVM)算法的几种常用非平衡数据分类方法进行实验比较,包括投票整合分类器和移动分类面等。在此基础上提出通过加权修正投票的整合策略,以提高预测效果。实验结果显示,结合多数类样本限数取样及整合思想的投票整合法预测效果优于移动分类面法,而在投票整合法基础上的加权修正整合方法在所有方法中获得更好更稳定的结果。 展开更多
关键词 支持向量机 功能预测 基因表达谱 不平衡
在线阅读 下载PDF
GO功能类与基因差异表达的关联规则挖掘算法 被引量:3
6
作者 屠康 喻辉 +1 位作者 郭政 李霞 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2004年第8期705-711,共7页
针对基因功能分类体系GeneOntology的层次结构特点 ,修改关联规则挖掘算法Apriori,开发“挖掘与基因差异表达关联的GO功能组合”软件 (RuleGO) .RuleGO以基因表达谱上的差异表达基因集合和不差异表达基因集合为输入 ,输出组合特征功能... 针对基因功能分类体系GeneOntology的层次结构特点 ,修改关联规则挖掘算法Apriori,开发“挖掘与基因差异表达关联的GO功能组合”软件 (RuleGO) .RuleGO以基因表达谱上的差异表达基因集合和不差异表达基因集合为输入 ,输出组合特征功能类与基因差异表达现象的关联规则 ,有助于解释基因差异表达现象的本质原因 ,如疾病发病机制、药物作用机理等 .将RuleGO和OntoExpress应用在结肠癌和腺癌表达谱数据集上 ,结果显示 ,RuleGO比OntoExpress能发现更多的与差异表达现象关联的特征功能类 ,更能看到在OntoExpress上不能发现的组合特征功能类 .另外 ,结果显示 ,将规则的置信度和支持度要求设置较高时 ,一般只有组合功能类才能满足要求 ,这提示在基因表达谱分析中不宜采用单个角度的单个功能分类单元 。 展开更多
关键词 基因表达谱 差异表达 关联规则 Gene ONTOLOGY 基因芯片技术
在线阅读 下载PDF
根据蛋白质互作网络预测乳腺癌相关蛋白质的细致功能 被引量:2
7
作者 王靖 李彦辉 +4 位作者 郭政 朱晶 马文财 彭春方 刘庆 《遗传》 CAS CSCD 北大核心 2007年第9期1061-1066,共6页
乳腺癌是最为常见的恶性肿瘤之一。已有的关于乳腺癌相关蛋白质的功能注释比较宽泛,制约了乳腺癌的后续研究工作。对于已知部分功能的乳腺癌相关蛋白质,提出了一种结合Gene Ontology功能先验知识和蛋白质互作的方法,通过构建功能特异的... 乳腺癌是最为常见的恶性肿瘤之一。已有的关于乳腺癌相关蛋白质的功能注释比较宽泛,制约了乳腺癌的后续研究工作。对于已知部分功能的乳腺癌相关蛋白质,提出了一种结合Gene Ontology功能先验知识和蛋白质互作的方法,通过构建功能特异的局部相互作用网络来预测乳腺癌相关蛋白质的细致功能。结果显示该方法能够以很高的精确率为乳腺癌相关蛋白质预测更为精细的功能。预测的相关蛋白质的功能对于指导实验研究乳腺癌的分子机制具有重要的价值。 展开更多
关键词 乳腺癌 蛋白质功能 预测 互作网络 基因本体
在线阅读 下载PDF
cDNA芯片缺失值处理对基于基因表达谱的疾病分类的影响 被引量:3
8
作者 王栋 郭政 +3 位作者 李霞 吕莹丽 朱晶 王晨光 《高技术通讯》 CAS CSCD 北大核心 2006年第5期501-505,共5页
选取了4套cDNA芯片数据,分别运用补零和K近邻的方法,对有检测缺失的基因进行了补缺失值处理,分析了不同处理对支持向量机、K近邻分类器、决策树三种分类器分类效能的影响.结果显示: 在cDNA基因表达谱数据中,对检测缺失率不高于5%的基... 选取了4套cDNA芯片数据,分别运用补零和K近邻的方法,对有检测缺失的基因进行了补缺失值处理,分析了不同处理对支持向量机、K近邻分类器、决策树三种分类器分类效能的影响.结果显示: 在cDNA基因表达谱数据中,对检测缺失率不高于5%的基因补缺失值是一种较好的策略,这样可以保留较多的基因供后续的功能分析,同时仍然能够保持很高的疾病分类效能. 展开更多
关键词 基因表达谱 缺失值 分类
在线阅读 下载PDF
基于基因功能表达谱的疾病分类:抗基因缺失的稳健性 被引量:3
9
作者 郭政 张田文 +1 位作者 王琦 李霞 《高技术通讯》 CAS CSCD 北大核心 2005年第6期78-81,共4页
利用基因表达谱数据,按 Gene Ontology基因功能分类体系,将基因模块化地组织到具有显著生物学意义的低维差异表达功能模块单元中,构造新的指标用于分类疾病样本,从而提出了基于功能表达谱的分析新途径.新算法可稳健地抗基因检测缺失,抗... 利用基因表达谱数据,按 Gene Ontology基因功能分类体系,将基因模块化地组织到具有显著生物学意义的低维差异表达功能模块单元中,构造新的指标用于分类疾病样本,从而提出了基于功能表达谱的分析新途径.新算法可稳健地抗基因检测缺失,抗基因表达变异,抗检测误差,并可以显著地降低分类特征维数(参与疾病分类的基因数目).采用淋巴瘤数据集,比较了基于功能表达谱和常规的基因表达谱的决策树分类器.结果显示,基于功能表达谱可以得到高准确度的疾病样本分类结果,能够直接从功能水平上给出相应的生物学解释.通过仿真分析,进一步显示了基于功能表达谱的分类方法具有抗基因检测缺失的稳健性. 展开更多
关键词 基因功能 稳健性 疾病 基因缺失 Ontology 基因检测 生物学意义 基因表达谱 分类体系 功能模块 差异表达 检测误差 基因数目 特征维数 树分类器 样本分类 仿真分析 分类方法 谱数据 地组织 模块化 新算法 数据集 淋巴瘤
在线阅读 下载PDF
基于IBD谱和基因组结构的复杂疾病相关分子标记识别的新策略(英文) 被引量:1
10
作者 李传星 杜磊 +3 位作者 李霞 宫滨生 张杰 饶绍奇 《北京大学学报(医学版)》 CAS CSCD 北大核心 2006年第1期74-77,共4页
Objective: To develop novel strategies to identify relevant molecular signatures for complex human diseases based on data of identical-by-decent profiles and genomic context.Methods: In the proposed strategies, we def... Objective: To develop novel strategies to identify relevant molecular signatures for complex human diseases based on data of identical-by-decent profiles and genomic context.Methods: In the proposed strategies, we define four relevancy criteria for mapping SNP-phenotype relationships-point-wise IBD mean difference, averaged IBD difference for window, Z curve and averaged slope for window.Results: Application of these criteria and permutation test to 100 simulated replicates for two hypothetical American populations to extract the relevant SNPs for alcoholism based on sib-pair IBD profiles of pedigrees demonstrates that the proposed strategies have successfully identified most of the simulated true loci.Conclusion: The data mining practice implies that IBD statistic and genomic context could be used as the informatics for locating the underlying genes for complex human diseases. Compared with the classical Haseman-Elston sib-pair regression method, the proposed strategies are more efficient for large-scale genomic mining. 展开更多
关键词 多态性 单核苷酸 医学信息学 多因子遗传 基因组
在线阅读 下载PDF
缺氧对视网膜色素上皮细胞基质细胞衍生因子-1和整合素连接激酶表达的影响 被引量:1
11
作者 王业青 李霞 +2 位作者 吕勇 王健 张晓梅 《中华实验眼科杂志》 CAS CSCD 北大核心 2012年第11期1013-1017,共5页
背景缺氧是诱导新生血管形成的主要因素,近年来越来越多的研究证实基质细胞衍生因子-1(SDF-1)和整合素连接激酶(ILK)在新生血管性疾病中发挥着重要作用,而缺氧对视网膜色素上皮(RPE)细胞SDF-1和ILK表达的影响尚未阐明。目的探... 背景缺氧是诱导新生血管形成的主要因素,近年来越来越多的研究证实基质细胞衍生因子-1(SDF-1)和整合素连接激酶(ILK)在新生血管性疾病中发挥着重要作用,而缺氧对视网膜色素上皮(RPE)细胞SDF-1和ILK表达的影响尚未阐明。目的探讨缺氧对体外培养RPE细胞中SDF-1和ILK表达的影响。方法从4周龄SPF级健康C57BL/6小鼠眼球中获取RPE组织并进行消化和培养,将达到80%融合的细胞进行传代。取第3代细胞制作细胞爬片后用细胞角蛋白18(CKl8)抗体进行免疫组织化学检测和鉴定,以5×104个/ml密度将RPE细胞接种于含胎牛血清的DMEM/F12培养液的培养瓶中,无血清饥饿培养24h后常氧组在常规培养基中进行培养,缺氧组在CoCl2浓度为200μmol/L的含胎牛血清的DMEM/F12培养液中进行培养,2个组根据培养时间的不同再亚分为1、3、6、12、24、48、72h组。采用逆转录PCR(RT-PCR)检测RPE细胞中SDF-1mRNA和ILKmRNA的表达,采用Westernblot检测RPE细胞中SDF-1蛋白和ILK蛋白的表达,均以目的基因A值/β-actinA值表示。结果培养的RPE细胞呈不规则多边形,细胞质内布满黑色素颗粒,90%以上的细胞对CK18呈阳性反应。随着CoCl2培养时间的延长,SDF-1mRNA和ILKmRNA的表达量逐渐增加,总体比较差异均有统计学意义(SDF-1 mRNA:F=281.875,P=0.000;ILKmRNA:F=187.566,P=0.000),12h达高峰,之后略有降低,但仍高于常氧组,缺氧1h组SDF-1mRNA及蛋白表达无明显变化;缺氧培养3、6、12、24、48、72h组SDF-1mRNA和ILKmRNA的表达量均明显高于常氧培养组,差异均有统计学意义(P〈0.01)。随着CoCl2培养时间的延长,SDF-1蛋白和ILK蛋白的表达量逐渐增加,差异均有统计学意义(SDF-1:F=44.719,P=0.000;ILK:F=144.481,P=0.000)。缺氧1h组SDF-1及ILK蛋白表达无明显变化;缺氧3、6、12、24、48、72h组SDF-1蛋白、ILK蛋白表达明显升高,与常氧组比较差异均有统计学意义(P〈O.01)。结论SDF-1和ILK参与了RPE细胞的缺氧反应,并且在缺血缺氧性视网膜病变的发生发展过程中可能发挥一定的作用。 展开更多
关键词 基质细胞衍生因子-1 整合素连接激酶 视网膜色素上皮细胞 CoCl2 缺氧
在线阅读 下载PDF
基于功能模块的基因表达谱聚类分析 被引量:1
12
作者 郭政 张田文 +1 位作者 王琦 王海芸 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第2期264-269,共6页
按GENE ONTOLOGY基因功能分类体系,将基因模块化地组织成具有显著生物意义的低维功能模块单元,并将其作为新的分析指标用于分类微阵列疾病样本,从而提出了基于功能表达谱的聚类分析新途径.采用NC I60数据集,通过功能表达谱对组织样本进... 按GENE ONTOLOGY基因功能分类体系,将基因模块化地组织成具有显著生物意义的低维功能模块单元,并将其作为新的分析指标用于分类微阵列疾病样本,从而提出了基于功能表达谱的聚类分析新途径.采用NC I60数据集,通过功能表达谱对组织样本进行聚类分析.结果显示,新算法不但得到高准确度的样本分型结果,而且能够直接从功能水平上给出相应的生物学解释.同时,用基于功能表达谱对组织样本进行聚类分析可以显著降低特征维数,有效地处理高检测误差与基因表达变异问题. 展开更多
关键词 基因表达谱 功能表达谱 基因功能分类体系 聚类
在线阅读 下载PDF
决策森林分析大型IBD谱定位酒精依赖症相关基因(英文)
13
作者 李霞 饶绍奇 +3 位作者 张薇 郭政 姜伟 杜磊 《北京大学学报(医学版)》 CAS CSCD 北大核心 2006年第1期71-73,共3页
Objective: To extract the relevant SNPs for alcoholism using sib-pair IBD profiles of pedigrees.Methods: We used the ensemble decision approach, a supervised learning approach based on decision forests, to locate alco... Objective: To extract the relevant SNPs for alcoholism using sib-pair IBD profiles of pedigrees.Methods: We used the ensemble decision approach, a supervised learning approach based on decision forests, to locate alcoholism relevant SNPs using genome-wide SNP data. Results: Application to a publicly available large dataset of 100 simulated replicates for three American populations (http://www.gaworkshop.org/) demonstrates that the proposed approach has successfully located all of the simulated true loci.Conclusion: The numerical results establish the proposed decision forest analysis to be a powerful and practical alternative for large-scale family-based association study. 展开更多
关键词 多态性 单核苷酸 酒精中毒 医学信息学 系谱 酒精依赖症 基因
在线阅读 下载PDF
同胞对间全基因组表达差异与SNP位点血缘一致性相关分析
14
作者 林慧 高磊 +2 位作者 华琳 李冬果 李霞 《中国生物医学工程学报》 CAS CSCD 北大核心 2009年第3期445-448,共4页
研究影响基因表达差异的调控机制对研究人类复杂性状的遗传机制具有重要意义。采用logistic回归分析方法,对基因在家系同胞对间是否存在较大表达差异与同胞对在SNPs位点共享同源等位基因的概率做回归分析,从而克服线性模型的束缚,并且... 研究影响基因表达差异的调控机制对研究人类复杂性状的遗传机制具有重要意义。采用logistic回归分析方法,对基因在家系同胞对间是否存在较大表达差异与同胞对在SNPs位点共享同源等位基因的概率做回归分析,从而克服线性模型的束缚,并且考虑到多个SNPs对基因表达的共同作用。选取14个CEPH三代家系的378个同胞对作为研究对象,对个体间差异显著的3 554个基因在2 492个SNPs位点上进行全基因组扫描,得到与3 101个基因在同胞对间是否存在较大表达差异显著相关的SNPs位点(P<0.001),并分析基因相应的cist、rans调控位点。结果表明,人类基因在同胞对间是否存在较大表达差异,与SNP位点血缘一致性有显著相关;结果还发现,存在多个基因的表达水平,在同胞对间是否存在较大差异都与同一SNP显著相关;将这些基因进行聚类,并且对其进行功能富集研究,发现在某些GO注释上存在显著富集现象。 展开更多
关键词 基因表达 SNPS 表达差异 IBD LOGISTIC回归
在线阅读 下载PDF
基于耦合双向聚类技术的DLBCL异质性分析
15
作者 李丽 李霞 +4 位作者 陈义汉 郭政 姜伟 张瑞杰 饶绍奇 《遗传》 CAS CSCD 北大核心 2006年第9期1129-1134,共6页
基因芯片技术为疾病异质性研究提供了有力的工具。当前基于传统聚类分析的方法一般利用芯片上大量基因作为特征来发现疾病的亚型,因此它们没有考虑到特征中包含的大量无关基因会掩盖有意义的疾病样本的分割。为了避免这个缺点,提出了基... 基因芯片技术为疾病异质性研究提供了有力的工具。当前基于传统聚类分析的方法一般利用芯片上大量基因作为特征来发现疾病的亚型,因此它们没有考虑到特征中包含的大量无关基因会掩盖有意义的疾病样本的分割。为了避免这个缺点,提出了基于耦合双向聚类的异质性分析方法(Heterogeneous Analysis Based on Coupled Two-WayClustering,HCTWC)来搜索有意义的基因簇以便发现样本的内在分割。该方法被应用于弥漫性大B细胞淋巴瘤(diffuselargeB-celllymphomaDLBCL)芯片数据集,通过识别的基因簇作为特征对DLBCL样本聚类发现生存期分别为55%和25%的两类DLBCL亚型(P<0.05),因此,HCTWC方法在解决疾病异质性是有效的。 展开更多
关键词 基因表达谱 疾病异质性 超顺磁性聚类 概念一致性
在线阅读 下载PDF
根据基因表达谱与基因功能模块研究大鼠抑郁症发病的分子机制
16
作者 杨达 钟国才 +7 位作者 李崇前 吕莹丽 张敏 王栋 王海敏 李强 郝晓峰 郭政 《高技术通讯》 CAS CSCD 北大核心 2007年第5期529-534,共6页
用Willner法构造大鼠抑郁症模型,由基因芯片检测8例模型和8例正常大鼠的基因表达谱,识别差异表达基因,寻找差异表达基因功能模块并构建基因表达相关网络,研究大鼠抑郁症模型的分子病理机制。在基因本体(GO)功能体系中寻找显著富集差... 用Willner法构造大鼠抑郁症模型,由基因芯片检测8例模型和8例正常大鼠的基因表达谱,识别差异表达基因,寻找差异表达基因功能模块并构建基因表达相关网络,研究大鼠抑郁症模型的分子病理机制。在基因本体(GO)功能体系中寻找显著富集差异表达基因的疾病相关功能模块,提取疾病相关功能模块中的基因构造表达相关网络,从中选择显著多地与其它基因共表达的基因定义为HUB基因,并进一步研究其与疾病的关系。筛选得到207个差异表达基因及13个差异表达基因功能模块,主要涉及神经肽激素活性、信号传导通路、核糖体生成以及蛋白质转运与降解。在共表达相关网络中进一步识别了4个差异表达的HUB基因。利用基因功能模块和表达相关网络研究疾病机制的结果显示,抑郁症的发病可能涉及单胺递质的释放、信号传导以及神经肽激素调节等通路协同作用。 展开更多
关键词 抑郁症 基因本体 基因表达谱 功能模块 表达相关网络
在线阅读 下载PDF
Oligo基因芯片的异常值处理对有监督疾病分类的影响
17
作者 吕莹丽 王栋 +4 位作者 郭政 于梁梁 李彦辉 朱晶 王晨光 《中国生物医学工程学报》 CAS CSCD 北大核心 2008年第1期69-75,共7页
基因芯片实验产生的表达谱数据中存在大量不合格的检测点,对异常值的不同处理,对于有监督疾病分类结果的影响很大。针对此问题,在Oligo芯片数据中,在表达水平层面,通常对检测值做最大值和最小值的预处理后,进行后续分析。本研究选取了四... 基因芯片实验产生的表达谱数据中存在大量不合格的检测点,对异常值的不同处理,对于有监督疾病分类结果的影响很大。针对此问题,在Oligo芯片数据中,在表达水平层面,通常对检测值做最大值和最小值的预处理后,进行后续分析。本研究选取了四套Oligo芯片数据集,采用不同限定芯片数据中最大值和最小值的方法,考察支持向量机、K近邻、决策树三种分类器对分类疾病样本效能的影响程度。结果显示:Dudoit等限定最大值和最小值分别为16000和100是一种合理的策略,可以达到很好的分类效果。同时发现对于小于100的检测值较多的数据集,采用限定最小值为10的策略同样能得到很好的分类效果,并可以为后续分析保留更多的原始数据。因此,合理限制Oligo芯片中的异常值,对于提高疾病分型是一种较好的策略。进一步采用功能表达谱方法,构造反映功能结点中全部注释基因的总体表达状态的均值或中值指标,利用构建的功能表达谱进行分类分析。发现不同异常值的限定方法对基于功能表达谱进行分类得到的准确率的影响较小,可以获得较稳定的分类结果。 展开更多
关键词 基因表达谱 异常值分类 功能表达谱
在线阅读 下载PDF
结合蛋白质互作与功能类的可分性预测蛋白质功能
18
作者 朱明珠 高磊 +5 位作者 李彦辉 马文才 朱晶 张敏 郭政 李霞 《中国生物医学工程学报》 CAS CSCD 北大核心 2009年第2期270-274,共5页
当前蛋白质功能注释体系的欠完备性限制了生物学及医药研究的进一步发展和应用,有必要将基因本体功能知识体系(GO)的功能注释信息进一步深化,把蛋白质注释到GO中更具体的功能节点。为此,提出一种结合互作信息的新的预测策略,将酵母蛋白... 当前蛋白质功能注释体系的欠完备性限制了生物学及医药研究的进一步发展和应用,有必要将基因本体功能知识体系(GO)的功能注释信息进一步深化,把蛋白质注释到GO中更具体的功能节点。为此,提出一种结合互作信息的新的预测策略,将酵母蛋白质准确地预测到更具体的功能类中。针对GO中的每个候选预测空间来构建分类器,并选用功能类分离性指标对候选预测空间进行评价,选出该指标大于一定阈值的候选预测空间,再将父节点中的蛋白质预测到子节点中。通过扩展深化预测的范围,可将预测空间一直上溯到根节点,对蛋白质功能进行深层预测,得到很好的预测结果。以上溯两层的预测空间为例,平均真阳性率和覆盖率分别达到94.02%和95.82%。 展开更多
关键词 蛋白质功能深化预测 基因本体功能知识体系(GO) 预测空间
在线阅读 下载PDF
同一代谢通路上基因表达相关性分析 被引量:2
19
作者 杜磊 李霞 +2 位作者 郭政 宫滨生 闻凤霞 《中国卫生统计》 CSCD 北大核心 2006年第1期83-85,共3页
关键词 基因表达谱 相关性分析 代谢通路 基因芯片技术 多元统计分析 模式识别方法 疾病状态 不同部位 生命体系 发育阶段
在线阅读 下载PDF
cDNA芯片重复探针检测值的一致性分析
20
作者 于梁梁 王栋 +5 位作者 吕莹丽 肖会 杨强 王晨光 郭政 李霞 《高技术通讯》 EI CAS CSCD 北大核心 2009年第1期95-98,共4页
通过SOURCE数据库对4套cDNA数据的探针进行了注释,分析了对应同一条Unigene的多个探针的检测值(即重复检测值)之间的相关性。采用两种常规方法处理了重复检测值,比较了这两种处理方法对筛选差异表达基因的影响。结果显示:Unigene的重复... 通过SOURCE数据库对4套cDNA数据的探针进行了注释,分析了对应同一条Unigene的多个探针的检测值(即重复检测值)之间的相关性。采用两种常规方法处理了重复检测值,比较了这两种处理方法对筛选差异表达基因的影响。结果显示:Unigene的重复检测值之间存在一定比例的负相关;更新探针注释数据后的重复检测值之间的低相关比例减少,高相关比例显著提高;重复点样探针之间的相关性高于其它重复检测值,但是仍有很多低相关;两种处理重复检测值方法对于用基因表达差异显著性分析方法(SAM)与T检验方法筛选差异表达基因影响不大。 展开更多
关键词 cDNA基因芯片 差异表达基因 相关系数 探针
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部