期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
低级别胶质瘤多组学数据整合的一致性聚类集成分子分型
1
作者 王彤 杨琪 +6 位作者 田雅昕 贾聪聪 罗艳虹 房瑞玲 余红梅 张岩波 曹红艳 《中国卫生统计》 北大核心 2025年第4期502-509,共8页
目的提出基于一致性聚类集成的多组学数据整合方法(multi-omics data integration with consensus clustering ensemble,MICCE),探讨MICCE方法在低级别胶质瘤(lower-grade gliomas,LGG)分子分型中的应用,识别预后高风险患者,筛选与LGG... 目的提出基于一致性聚类集成的多组学数据整合方法(multi-omics data integration with consensus clustering ensemble,MICCE),探讨MICCE方法在低级别胶质瘤(lower-grade gliomas,LGG)分子分型中的应用,识别预后高风险患者,筛选与LGG进展相关的差异基因以及重要通路。方法采用一致性聚类集成方法集成LGG患者多组学数据整合分型的7种方法(SNF、joint SNF、CIMLR、ConsensusClusterPlus、MoCluster、NEMO、iClusterBayes),得到一致性分型结果,采用Cox回归研究不同分型患者的预后风险;进一步筛选出DEmRNAs(differentially expressed mRNAs),DEmiRNAs(differentially expressed miRNAs)和DMGs(differentially methylated genes),并对差异基因进行GO生物功能注释和KEGG通路分析;最后进行免疫细胞浸润和通路活性分析。结果LGG患者分为预后高危组,中危组和低危组,其中高危组的死亡风险是低危组的7.70倍;筛选出2512个DEmRNAs,14个DEmiRNAs和255个DMGs,包括5个核心基因;将基因联合分析得到的665个重合基因进行GO富集和KEGG富集分析,得到62条GO富集项和52条KEGG富集项;免疫细胞浸润和通路活性分析表明,存在显著差异的2种浸润细胞和4条通路。结论MICCE能够有效识别出LGG预后高风险患者,并发现与LGG进展相关的差异基因和不同亚型的肿瘤相关通路,为LGG的个性化治疗提供重要线索。 展开更多
关键词 聚类集成 组学数据整合 分子亚型 低级别胶质瘤
在线阅读 下载PDF
个性化医疗的基础是尿的组学数据
2
作者 高友鹤 《质谱学报》 北大核心 2025年第5期531-531,共1页
个性化医学正推动人类医学史上前所未有的范式革命,远期愿景不仅是精准诊疗,还将重塑全民健康管理生态系统,实现“每个个体在正确时间获得最优干预”。个性化识别并不困难,但个性化医疗需要大量描述健康状态的指标。基因组学数据虽能揭... 个性化医学正推动人类医学史上前所未有的范式革命,远期愿景不仅是精准诊疗,还将重塑全民健康管理生态系统,实现“每个个体在正确时间获得最优干预”。个性化识别并不困难,但个性化医疗需要大量描述健康状态的指标。基因组学数据虽能揭示疾病分子基础,提升癌症疗效,但其难以灵敏反映身体生理病理状态的即时变化,且基因与疾病表型只是间接相关联。蛋白质是生命活动主要执行者,代谢产物是生物化学反应最终产物,它们直接参与细胞生理过程。蛋白质组和代谢组变化与疾病表型关联紧密,机体发生生理病理变化时,二者会迅速改变。 展开更多
关键词 精准诊疗 个性化医疗 尿的组学数据
在线阅读 下载PDF
基于深度学习的低级别胶质瘤多组学数据整合稳健分型
3
作者 杜港 贾聪聪 +4 位作者 赵鑫 田雅昕 房瑞玲 张岩波 曹红艳 《中国卫生统计》 北大核心 2025年第2期185-190,共6页
目的 多组学数据的高噪稀疏性以及存在异常值,易导致多组学数据整合分型稳健性不足,本研究提出将深度学习中的自编码器与最优化稳健伪极大似然估计器(optimally tuned robust improper maximum likelihood estimator, OTRIMLE)结合的方... 目的 多组学数据的高噪稀疏性以及存在异常值,易导致多组学数据整合分型稳健性不足,本研究提出将深度学习中的自编码器与最优化稳健伪极大似然估计器(optimally tuned robust improper maximum likelihood estimator, OTRIMLE)结合的方法,并将其应用于低级别胶质瘤(lower-grade gliomas, LGG)患者分型。方法 采用自编码器对LGG的miRNA、mRNA和甲基化数据进行非线性降维,串联后采用OTRIMLE方法进行稳健分型。对最终的分型结果,利用Cox比例风险模型分析不同分型的预后风险,使用差异表达分析筛选出DEmiRNAs(differentially expressed miRNAs),DEmRNAs(differentially expressed mRNAs)和DMGs(differentially methylated genes),对DEmiRNAs的靶基因、DEmRNAs和DMGs三者的重合基因进行GO富集分析,最后对不同分型的患者进行免疫细胞浸润与通路活性分析。结果 将LGG患者分为四型,其中分型4患者的死亡风险是分型3患者的5.903倍。筛选出8个DEmiRNAs, 2890个DEmRNAs和46个DMGs,联合分析得到的658个重合基因富集于423条GO生物项。筛选出13条活性存在差异的通路以及4种存在差异的免疫浸润细胞。结论 基于深度学习的OTRIMLE方法对多组学数据高噪稀疏性和存在异常点时具有稳健性,有效实现了LGG患者的稳健分型,并筛选出了具有统计学差异的免疫细胞与通路等,可为LGG后续针对性治疗提供理论依据。 展开更多
关键词 稳健分型 深度 组学数据 低级别胶质瘤
在线阅读 下载PDF
一种面向功能基因挖掘的动物多组学数据集
4
作者 刘洪 窦婧文 +5 位作者 王越 廖勇 刘小磊 李新云 赵书红 付玉华 《农业大数据学报》 2025年第1期96-106,共11页
单一的组学数据难以全面揭示基因调控性状的复杂分子机制,整合不同类型和层次的生物组学数据对于理解生物体内复杂的分子网络具有重要的意义。本数据集提供了包含21个动物物种的61191个个体水平组学数据(WGS、RNA-Seq、ChIP-Seq和ATAC-S... 单一的组学数据难以全面揭示基因调控性状的复杂分子机制,整合不同类型和层次的生物组学数据对于理解生物体内复杂的分子网络具有重要的意义。本数据集提供了包含21个动物物种的61191个个体水平组学数据(WGS、RNA-Seq、ChIP-Seq和ATAC-Seq)和基因组注释信息,有效数据规模为2.8 TB。此外,本数据集还收录了基于深度学习算法得到的基因与表型实体识别数据。总的来说,该多组学数据集可用于农业重要性状的基因发掘和功能验证,能够为跨物种比较研究提供有价值的资源,也可更好地服务于动物经济性状关键基因识别模型构建以及算法研究。 展开更多
关键词 组学数据 跨物种 功能基因挖掘 个体水平 深度
在线阅读 下载PDF
整合多源转录组学数据鉴别哮喘发生上皮细胞的潜在生物标志物
5
作者 谢连华 卢淑娴 +2 位作者 郭芳阳 张弋峰 刘潜 《细胞与分子免疫学杂志》 北大核心 2025年第8期695-705,共11页
目的基于多源转录组学数据的生物信息学分析,挖掘哮喘上皮细胞的潜在生物标志物,并通过哮喘模型的肺组织及其上皮细胞验证潜在靶基因的表达。方法整合基因表达数据集(GEO)数据库中3组哮喘患者和正常对照组上皮细胞的基因表达谱数据,通... 目的基于多源转录组学数据的生物信息学分析,挖掘哮喘上皮细胞的潜在生物标志物,并通过哮喘模型的肺组织及其上皮细胞验证潜在靶基因的表达。方法整合基因表达数据集(GEO)数据库中3组哮喘患者和正常对照组上皮细胞的基因表达谱数据,通过基因差异表达分析和基因共表达网络分析,鉴别与哮喘相关的关键基因及生物学通路。最后,利用哮喘动物模型在肺组织和肺组织上皮细胞验证主要关键基因。结果通过差异基因表达分析,哮喘上皮细胞与正常对照组相比,存在1121个上调基因和1484个下调基因。生物学通路富集分析表明,上调基因主要参与糖基化过程,下调基因主要参与免疫细胞分化过程。基因共表达网络分析发现,糖基化相关通路的模块9与哮喘呈显著正相关,而参与胰岛素等信号通路的模块17与哮喘呈显著负相关。我们发现多肽N-乙酰半乳糖胺转移酶5(GALNT5)、吡咯啉-5-羧酸还原酶-1(PYCR1)和癌胚抗原相关细胞黏附分子5(CEACAM5)基因是模块9的关键基因且在哮喘中显著上调。最后,我们在哮喘肺组织上皮细胞中验证了GALNT5、PYCR1和CEACAM5在模型组中表达均上调。同时,通过构建大鼠哮喘模型,我们进一步证实了这三个基因的蛋白水平在模型组肺组织中也显著上调。结论本研究通过数据整合和实验验证,鉴定出与哮喘疾病发展密切相关的关键基因和生物学通路,这些结果为哮喘的诊断和治疗提供新的理论基础和潜在靶点。 展开更多
关键词 多源转录组学数据 基因共表达网络 上皮细胞 生物标志物 生物通路
在线阅读 下载PDF
桃多组学数据库发布
6
《农业科技与信息》 2025年第7期52-52,共1页
近日,中国农业科学院郑州果树研究所桃遗传育种团队首次集成桃基因组、表观遗传组、群体遗传变异及多维度表型数据,并深度整合基因编辑设计与全基因组关联分析等工具,发布桃多组学数据库PeachMD。该研究为推动桃分子育种和功能基因组学... 近日,中国农业科学院郑州果树研究所桃遗传育种团队首次集成桃基因组、表观遗传组、群体遗传变异及多维度表型数据,并深度整合基因编辑设计与全基因组关联分析等工具,发布桃多组学数据库PeachMD。该研究为推动桃分子育种和功能基因组学研究提供数据支持。相关研究成果发表在《分子园艺(Molecular Horticulture)》。 展开更多
关键词 PeachMD 表观遗传 桃多组学数据
在线阅读 下载PDF
基于生存结局加权多组学数据整合的胶质瘤分子分型
7
作者 贾聪聪 杜港 +5 位作者 赵鑫 师国京 房瑞玲 李治 张岩波 曹红艳 《中国卫生统计》 CSCD 北大核心 2024年第5期644-649,共6页
目的探讨将生存结局加权的多组学数据整合方法survClust应用于胶质瘤(glioma)数据,以识别具有显著分子异质性和预后差异的胶质瘤分子分型。方法采用survClust方法对中国胶质瘤基因数据库(Chinese glioma genome atlas,CGGA)的胶质瘤多... 目的探讨将生存结局加权的多组学数据整合方法survClust应用于胶质瘤(glioma)数据,以识别具有显著分子异质性和预后差异的胶质瘤分子分型。方法采用survClust方法对中国胶质瘤基因数据库(Chinese glioma genome atlas,CGGA)的胶质瘤多组学数据进行结局加权整合分型,并拟合Cox比例风险模型评估不同分型患者预后。对不同分型间的差异表达基因(DEmiRNAs,DEmRNAs,DMGs)进行筛选,对DEmiRNAs靶基因、DEmRNAs、DMGs的重合基因进行GO功能注释;最后对不同分型患者进行免疫浸润分析。结果survClust将胶质瘤患者分为高危组和低危组,高危组患者的死亡风险是低危组的2.931倍。不同分型差异基因的分布存在差异,共筛选出194个DEmiRNAs,3396个DEmRNAs,1230个DMGs。将189个重合基因进行GO功能注释,得到52条差异具有统计学意义的GO生物项。此外,不同分型在B淋巴细胞、CD4+T细胞、CD8+T细胞、中性粒细胞、巨噬细胞和髓样树突状细胞的免疫浸润水平存在统计学差异。结论结局加权整合算法survClust能够有效识别兼具分子异质性和显著预后差异的胶质瘤亚型,同时基于分型结果筛选出的潜在生物标志物将为胶质瘤的个性化治疗提供科学理论依据。 展开更多
关键词 生存结局加权聚类 分子亚型 组学数据整合 胶质瘤
在线阅读 下载PDF
网络增强核融合方法的改进及其在乳头状肾细胞癌多组学数据整合分子分型中的应用
8
作者 师国京 李灵梅 +6 位作者 魏亿芳 赵鑫 房瑞玲 杨海涛 余红梅 张岩波 曹红艳 《中国卫生统计》 CSCD 北大核心 2024年第3期376-381,共6页
目的针对网络增强的相似网络融合(network enhancement fusion,ne-SNF)方法先融合不同组学网络,再对融合后的网络降噪,忽略了不同组学相似网络噪声对融合网络影响的问题,本文提出了改进的网络增强融合(improved network enhancement fus... 目的针对网络增强的相似网络融合(network enhancement fusion,ne-SNF)方法先融合不同组学网络,再对融合后的网络降噪,忽略了不同组学相似网络噪声对融合网络影响的问题,本文提出了改进的网络增强融合(improved network enhancement fusion,improved ne-SNF)方法,并探讨其在乳头状肾细胞癌(papillary renal cell carcinoma,PRCC)分子分型中的应用,识别PRCC高危患者,筛选重要通路及免疫浸润细胞。方法通过模拟研究评估improved ne-SNF分型性能,并将其用于PRCC多组学数据的整合分型,利用Cox回归模型分析不同分型患者的预后风险;筛选不同分型的差异表达mRNA(DEmRNAs)、miRNA(DEmiRNAs)及差异甲基化基因(DMGs),并对其重合基因进行KEGG通路分析;最后对不同分型患者进行免疫细胞浸润分析。结果模拟研究结果表明improved ne-SNF在不同信号比例和噪声强度下的分型准确性均优于SNF和ne-SNF。improved ne-SNF方法将PRCC患者分为高危组和低危组,高危组患者的死亡风险是低危组的7.727倍;筛选出3511个DEmRNAs,96个DEmiRNAs及3426个DMGs,其联合分析的649个重合基因得到42条有统计学差异的KEGG通路。此外,筛选出3种在不同分型中存在统计学差异的免疫浸润细胞。结论improved ne-SNF分型性能优于SNF和ne-SNF,且能够有效识别PRCC预后高风险患者,并筛选出PRCC重要通路及相关免疫浸润细胞,为PRCC的治疗及预后提供新的思路和参考依据。 展开更多
关键词 改进的网络增强融合 乳头状肾细胞癌 组学数据整合 分子亚型
在线阅读 下载PDF
多组学数据驱动的机器学习模型在乳腺癌生存及治疗响应预测中的应用 被引量:6
9
作者 章子怡 王棨临 +4 位作者 张俊有 段迎迎 刘家欣 刘赵硕 李春燕 《遗传》 CAS CSCD 北大核心 2024年第10期820-832,共13页
乳腺癌的高度异质性导致其治疗及预后评估较为复杂。治疗方案的选择受到肿瘤亚型、病变分级、基因型等多种因素的影响,因此需要制定个体化治疗策略。患者的预后效果因病情不同而产生显著差异。作为人工智能的一个重要分支,机器学习能高... 乳腺癌的高度异质性导致其治疗及预后评估较为复杂。治疗方案的选择受到肿瘤亚型、病变分级、基因型等多种因素的影响,因此需要制定个体化治疗策略。患者的预后效果因病情不同而产生显著差异。作为人工智能的一个重要分支,机器学习能高效处理海量数据,并实现决策过程的自动化。机器学习方法的引入将为乳腺癌治疗的选择和预后评估提供新的解决方案。在癌症治疗领域,传统方法预测生存与治疗效果往往依赖于单一或少量的生物标志物,难以全面捕捉复杂的生物学过程。机器学习通过分析患者的多组学数据以及它们在疾病发生发展过程中复杂的变化趋势,预测患者的生存和治疗响应效果,从而选择适合的治疗措施,实施早期干预,改善患者的治疗效果。本文首先介绍了常用的机器学习方法,在此基础上分别从评估生存情况和预测治疗效果这两方面展开,详细分析了机器学习在乳腺癌患者生存预测及预后领域中的应用,以期为乳腺癌患者提供精准医疗治疗策略,提高治疗效果和生存质量。 展开更多
关键词 乳腺癌 机器 组学数据整合分析 生存预测 治疗响应
在线阅读 下载PDF
基于多维组学数据的玉米农艺和品质性状预测研究
10
作者 杨静蕾 吴冰杰 +1 位作者 王安洲 肖英杰 《作物学报》 CAS CSCD 北大核心 2024年第2期373-382,共10页
基因组选择是利用覆盖基因组的高密度标记对未知表型进行预测并选择的技术。在植物中,利用该技术可对不同作物性状进行早期选择,保留优势个体,节约田间管理和表型鉴定成本,大大加快育种进程。本研究使用rrBLUP和LASSO两种统计模型,基于... 基因组选择是利用覆盖基因组的高密度标记对未知表型进行预测并选择的技术。在植物中,利用该技术可对不同作物性状进行早期选择,保留优势个体,节约田间管理和表型鉴定成本,大大加快育种进程。本研究使用rrBLUP和LASSO两种统计模型,基于基因组、转录组和代谢组数据对玉米的农艺性状和品质性状进行了基因组预测。研究发现,对于不同组学数据而言,其预测能力高低依次为基因组、转录组、代谢组数据。对于不同性状而言,品质性状的预测能力高于农艺性状。对于rrBLUP和LASSO两种模型而言,基于基因组数据预测时所有性状均是rrBLUP为最优预测模型;基于转录组数据预测时有53种性状是以rrBLUP为最佳预测模型, 2种性状以LASSO为最佳预测模型;基于代谢组数据,有43种性状以rrBLUP为最佳预测模型, 12种性状以LASSO为最佳预测模型。此外,还发现用不同系谱材料进行预测时,热带玉米预测温带玉米,其效果略优于温带玉米预测热带玉米。而对于品质性状,不同系谱间材料的预测精度高于同一系谱内。本研究系统评估了各种组学数据和不同统计模型对玉米农艺及品质性状预测能力的差异,为未来玉米重要性状的基因组育种提供了理论依据。 展开更多
关键词 玉米 农艺和品质性状 基因预测 多维组学数据
在线阅读 下载PDF
基于组学数据的生物学模块识别方法研究进展
11
作者 刘芝霖 荣志炜 +3 位作者 黄吉科 宋佳丽 俞轶培 侯艳 《中国卫生统计》 CSCD 北大核心 2024年第4期635-640,共6页
组学数据在分子层面上加深了研究者对表型相似疾病的辨别能力及对认识不足疾病的理解,对组学数据的分析能够在疾病的诊断与治疗中发挥至关重要的作用。组学分子间存在复杂的调控关系,过去的研究表明细胞的功能是模块化的^([1]),在疾病... 组学数据在分子层面上加深了研究者对表型相似疾病的辨别能力及对认识不足疾病的理解,对组学数据的分析能够在疾病的诊断与治疗中发挥至关重要的作用。组学分子间存在复杂的调控关系,过去的研究表明细胞的功能是模块化的^([1]),在疾病的实际进展中,关键的调控网络出现异常往往表现为网络中所有分子表达水平都发生变化^([2]),因此表达模式相似的分子很可能存在共调控或功能相关的情况^([3])。 展开更多
关键词 辨别能力 组学数据 调控网络 表达模式 分子层面 模块化 调控关系 生物
在线阅读 下载PDF
从多组学数据挖掘结核病关键基因的综合策略 被引量:2
12
作者 张旭 陈冬东 +2 位作者 叶志强 李启明 谢建平 《工程数学学报》 CSCD 北大核心 2018年第5期515-522,共8页
如何确定参与肺结核易感性的相互作用和潜在网络的关键宿主基因是一项非常重要的任务.到目前为止,只有少数宿主基因被发现和证实与结核病有关.本文利用显著性分析及聚类等数学、统计学方法分析了两组和结核病相关的组学数据,发现14个可... 如何确定参与肺结核易感性的相互作用和潜在网络的关键宿主基因是一项非常重要的任务.到目前为止,只有少数宿主基因被发现和证实与结核病有关.本文利用显著性分析及聚类等数学、统计学方法分析了两组和结核病相关的组学数据,发现14个可能性最大的结核病候选易感基因,其全部被文献报道参与各种重要的生物过程,更有五个被报道与结核病有关.这表明通过综合应用多种数学、统计学方法分析组学数据有助于缩小结核疾病相关基因的候选名单. 展开更多
关键词 组学数据 基因 显著性检验 结核病 聚类
在线阅读 下载PDF
模糊聚类法在动态设计组学数据趋势聚类中的应用 被引量:2
13
作者 王璐 张涛 +3 位作者 刘佳 刘盈君 公晓云 薛付忠 《中国卫生统计》 CSCD 北大核心 2015年第1期2-5,9,共5页
目的探讨模糊C均值聚类方法(FCM)在动态设计组学数据不同动态趋势聚类中的应用。方法使用模糊C均值聚类方法,分别对模拟的动态数据和动态基因表达进行聚类,识别不同的变化模式。结果对模拟数据的分析显示,FCM可以准确地识别模拟设定的... 目的探讨模糊C均值聚类方法(FCM)在动态设计组学数据不同动态趋势聚类中的应用。方法使用模糊C均值聚类方法,分别对模拟的动态数据和动态基因表达进行聚类,识别不同的变化模式。结果对模拟数据的分析显示,FCM可以准确地识别模拟设定的不同动态变化趋势,并将其聚为一类;同时,通过设定隶属度阈值我们可以避免对噪声变量的聚类。而对动态基因组表达数据的实例分析表明FCM可以有效地将具有相同表达模式的基因聚类,并且能给出类间关系。结论模糊C-均值聚类可以用于动态组学数据不同动态变化模式的聚类,帮助我们更有效地探索生物信息。 展开更多
关键词 动态组学数据 模糊C均值聚类
在线阅读 下载PDF
多组学数据整合分析和应用研究综述 被引量:15
14
作者 钟雅婷 林艳梅 +2 位作者 陈定甲 彭昱忠 曾远鹏 《计算机工程与应用》 CSCD 北大核心 2021年第23期1-17,共17页
随着组学新测序技术的不断涌现和推广,产生了大量的组学数据,这些数据对人们深入研究和揭示生命奥秘有着极重要的意义。利用多组学数据整合技术分析生命科学问题可获得更丰富更全面的生命系统相关信息,已成为研究者探索生命机制的新方... 随着组学新测序技术的不断涌现和推广,产生了大量的组学数据,这些数据对人们深入研究和揭示生命奥秘有着极重要的意义。利用多组学数据整合技术分析生命科学问题可获得更丰富更全面的生命系统相关信息,已成为研究者探索生命机制的新方向。介绍了多组学数据整合分析的研究背景和研究意义,综述了近年来多组学数据整合分析的方法和相关领域的应用研究,探讨了多组学数据整合分析方法当前所存在的问题以及未来展望。 展开更多
关键词 组学数据 组学数据分析 生物信息 数据整合
在线阅读 下载PDF
具有局部和全局注意力机制的图注意力网络学习单样本组学数据表征 被引量:3
15
作者 周丰丰 张金楷 《吉林大学学报(理学版)》 CAS 北大核心 2023年第6期1351-1357,共7页
针对生物组学数据中基因数目远大于样本数目的高维“大p小n”问题,提出一种具有局部和全局注意力机制的图注意力网络GATOr.该模型首先在组学数据上利用Pearson相关系数计算特征之间的相关性,构建组学数据的单样本网络;然后提出一种结合... 针对生物组学数据中基因数目远大于样本数目的高维“大p小n”问题,提出一种具有局部和全局注意力机制的图注意力网络GATOr.该模型首先在组学数据上利用Pearson相关系数计算特征之间的相关性,构建组学数据的单样本网络;然后提出一种结合局部和全局注意力机制的图注意力网络从单样本网络中学习基于图的组学特征表示,从而将组学数据的高维特性转化为低维表示.实验结果表明,GATOr与其他传统分类算法相比,在分类任务的准确率及其他指标上均取得了较优性能. 展开更多
关键词 组学数据 单样本网络 注意力机制 图注意力网络
在线阅读 下载PDF
自适应性FDR控制程序原理及组学数据应用
16
作者 王子兴 薛芳 姜晶梅 《中国卫生统计》 CSCD 北大核心 2023年第1期68-73,共6页
目的高维组学数据分析常伴随多重检验问题,不当处理可造成检验效能低下或阳性发现错误率(FDR)升高。FDR已发展为一类新的控制标准,衍生出一系列理论和方法。方法本研究首先对一类自适应性FDR控制方法原理及条件进行介绍,其基于Benjamini... 目的高维组学数据分析常伴随多重检验问题,不当处理可造成检验效能低下或阳性发现错误率(FDR)升高。FDR已发展为一类新的控制标准,衍生出一系列理论和方法。方法本研究首先对一类自适应性FDR控制方法原理及条件进行介绍,其基于Benjamini-Hochberg程序,由数据自适应性地估计真实原假设数(m 0)进而对FDR实现控制;具体方法包括迭代式、分位数(中位数、定值)、多阶段、阈值函数调整、m 0外插等。进一步,将上述方法用于肺癌患者CT图像特征和COVID-19患者血清蛋白表达两个实例分析。结果相对两项分析中的控制前结果,各自适应性FDR控制方法均降低了阳性发现数,并相比Bonferroni校正结果很大程度保留了阳性比例。然而蛋白表达实例提示,该类程序无法从根本上解决结果不稳定性问题。通过数据拆分验证,适当降低拟控制水平并以各方法的结果进行综合评估,可使筛选结果稳定性得到一定程度提升。结论由于自适应性FDR控制程序基于样本估计m 0且需满足特定结构假设,高维小样本组学数据的结构复杂性可对其分析效果产生影响,故建议进行方法间的联合应用和综合评价。在阳性发现比例较大时,经典的线性递增程序不失为一种简易、稳健且有效的FDR控制方法。 展开更多
关键词 阳性发现错误率 多重检验 组学数据 自适应性控制程序
在线阅读 下载PDF
基于癌症基因组图谱计划多组学数据构建胶质母细胞瘤六基因预后模型 被引量:4
17
作者 雷常贵 贾学渊 孙文靖 《遗传》 CAS CSCD 北大核心 2021年第7期665-679,I0002-I0011,共25页
胶质母细胞瘤(glioblastoma,GBM)是最常见的原发性颅内肿瘤,恶性程度极高,患者预后极差。为了识别GBM预后生物标记物,建立预后模型,本研究通过分析癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)数据库中GBM的表达谱数据,筛选出不... 胶质母细胞瘤(glioblastoma,GBM)是最常见的原发性颅内肿瘤,恶性程度极高,患者预后极差。为了识别GBM预后生物标记物,建立预后模型,本研究通过分析癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)数据库中GBM的表达谱数据,筛选出不同生存期GBM患者差异基因。利用GISTIC软件和Kaplan-Meier(KM)生存分析方法分析TCGA数据库中的GBM拷贝数变异数据,识别影响生存的扩增基因(survival-associated amplified gene,SAG)。取短生存期组上调基因和SAG两者的交集基因,进行单因素Cox回归和迭代Lasso回归筛选重要候选基因并建立预后模型;计算预后评分,根据预后评分中位数将患者分为高风险组和低风险组。用ROC曲线判断模型的优良,KM生存分析高低风险组预后差异,并用GEO、CGGA和Rembrandt数据库3个外部数据集进行验证。多因素Cox回归分析判断预后评分的预后独立性。结果显示,GBM不同生存期差异分析得到上调基因426个,下调基因65个。短生存期组上调基因与SAG交集得到47个基因。经过筛选,最终确定六基因(EN2、PPBP、LRRC61、SEL1L3、CPA4、DDIT4L)预后模型。TCGA实验组和3个外部验证组模型的ROC曲线下面积均大于0.6,甚至达到0.912。KM分析显示高低风险组的预后都存在差异(P<0.05)。在多因素Cox回归分析中,六基因预后评分是GBM患者预后的独立影响因素(P<0.05)。通过一系列分析,本研究确立了六基因(EN2、PPBP、LRRC61、SEL1L3、CPA4、DDIT4L)的GBM预后模型,模型具有很好的预测能力,可作为预测GBM患者的独立预后标志物。 展开更多
关键词 胶质母细胞瘤 组学数据 六基因 预后模型 癌症基因图谱计划
在线阅读 下载PDF
多组学数据分析中关联网络融合ANF算法及应用研究 被引量:1
18
作者 徐臻旖 王策 +1 位作者 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2020年第6期822-827,共6页
目的引入关联网络融合(affinity network fusion,ANF)方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法模拟产生两组学数据,改变总体差异大小等情况比较多种多组学整合方法的效果。实例分析中目标人群选择TCGA数据库中对... 目的引入关联网络融合(affinity network fusion,ANF)方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法模拟产生两组学数据,改变总体差异大小等情况比较多种多组学整合方法的效果。实例分析中目标人群选择TCGA数据库中对铂类药物敏感并拥有mRNA和甲基化两个组学的卵巢癌患者,目标基因是TCGA数据库和ImmPort数据库中共有基因,目标甲基化位点是目标基因对应的所有甲基化位点。使用ANF、SNF、K-means、系统聚类和iCluster五种方法比较聚类效果。结果模拟实验提示存在总体差异的两亚型间差异较小时ANF方法的效果明显优于其他方法。实例分析结果表明,通过ANF方法进行多组学数据整合得到的分子分型较单组学得到的分子分型有更好的生物学意义且多组学聚类效果优于其他方法。结论ANF方法可以应用于多组学数据整合分析,具有实际应用意义。 展开更多
关键词 ANF方法 组学数据整合 免疫分型
在线阅读 下载PDF
JIVE方法在卵巢癌多组学数据整合分析中的应用 被引量:1
19
作者 徐欢 宋微 +2 位作者 蔡雨晴 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2019年第5期774-776,共3页
目的引入JIVE方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法使用TCGA数据库中卵巢癌mRNA和miRNA的组学数据,应用JIVE方法整合分析两个组学数据,提取两不同组学数据的共同特征,然后通过对其具有共同结构的数据做主成分分... 目的引入JIVE方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法使用TCGA数据库中卵巢癌mRNA和miRNA的组学数据,应用JIVE方法整合分析两个组学数据,提取两不同组学数据的共同特征,然后通过对其具有共同结构的数据做主成分分析,给出卵巢癌miRNA分子分型的结果。结果经过JIVE方法整合分析后,使miRNA数据具有明显与mRNA相一致的分型结构,从而进一步支持了mRNA的分型结果,同时揭示了两组学之间在组织分子分型上具有一定的调控关系。结论JIVE方法可以用于提取组学之间存在的共同结构矩阵,从而进行多组学数据的整合分析。 展开更多
关键词 JIVE方法 组学数据整合 特征提取
在线阅读 下载PDF
基于多组学数据识别癌症驱动通路的模型和算法 被引量:2
20
作者 蔡齐荣 吴璟莉 《计算机科学》 CSCD 北大核心 2019年第9期310-314,共5页
通过整合体细胞突变、拷贝数变异和基因表达等3种组学数据,提出识别癌症驱动通路的改进最大权重子矩阵模型。该模型用通路中基因平均权重调控覆盖度和互斥度,对权重大的基因集覆盖度进行加强,同时放松其高互斥度约束。引入基于贪心算法... 通过整合体细胞突变、拷贝数变异和基因表达等3种组学数据,提出识别癌症驱动通路的改进最大权重子矩阵模型。该模型用通路中基因平均权重调控覆盖度和互斥度,对权重大的基因集覆盖度进行加强,同时放松其高互斥度约束。引入基于贪心算法的重组算子,提出求解该模型的单亲遗传算法PGA-MWS。采用胶质母细胞瘤和卵巢癌数据集对算法PGA-MWS和GA进行实验对比分析。实验结果显示,较GA方法,基于改进模型的PGA-MWS算法能识别出覆盖度高但互斥度不太高的基因集,且其识别的基因集中,许多均参与已知信号通路,并被证实与癌细胞密切相关,同时还能识别几种潜在的候选驱动通路,因此PGA-MWS方法可作为检测癌症驱动通路的一种有效补充。 展开更多
关键词 驱动通路 组学数据 癌症 算法 模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部