通过在基因组水平上对成千上万的单核苷酸多态性(single nucleotide polymorphism,SNP)进行系统性检测和分析,全基因组关联性研究(genome-wide association study,GWAS)发现了一系列与人类复杂性状和疾病(比如,身高、恶性肿瘤、糖...通过在基因组水平上对成千上万的单核苷酸多态性(single nucleotide polymorphism,SNP)进行系统性检测和分析,全基因组关联性研究(genome-wide association study,GWAS)发现了一系列与人类复杂性状和疾病(比如,身高、恶性肿瘤、糖尿病和高血压)相关的常见遗传变异位点[1-3]。展开更多
目的本研究旨在评价二代测序数据中关联性分析方法。以往运用于全基因组关联性研究(genome-wide association study,GWAS)中的方法能否在全外显子测序数据中有良好的精确度,对于未来测序数据的挖掘有重要的意义。方法利用英国生物样本库...目的本研究旨在评价二代测序数据中关联性分析方法。以往运用于全基因组关联性研究(genome-wide association study,GWAS)中的方法能否在全外显子测序数据中有良好的精确度,对于未来测序数据的挖掘有重要的意义。方法利用英国生物样本库(UK biobank,UKB)45万人全外显子测序数据,模拟不同病例占比、不同亲缘关系占比的数据集,采用BOLT-LMM,SAIGE,fastGWA-GLMM和REGENIE四种常见的关联性分析算法对各种情景下的数据集进行模拟试验,评价指标主要是一类错误、运行时间和内存占用。根据不同情景下模拟试验结果,寻找效果最优的方法。结果SAIGE和REGENIE在各种情况下均能较好的控制一类错误,计算效率也较高。面对亲缘关系占比高,亲缘关系复杂的数据时,fastGWA-GLMM表现较差。BOLT-LMM不适用于二元表型,不推荐用于实际工作。结论综合比较,基于广义混合模型的SAIGE和基于机器学习的REGENIE适用于二代测序数据关联性分析。展开更多
目的鉴于国内研究者熟悉的贝叶斯统计软件WinBUGS已停止更新,OpenBUGS已见介绍,本文介绍国外新近出现的贝叶斯统计软件Stan的基本原理与实际使用。方法由于Stan安装具有其自身特点且较为复杂,本文首先介绍Windows平台下Stan安装与使用方...目的鉴于国内研究者熟悉的贝叶斯统计软件WinBUGS已停止更新,OpenBUGS已见介绍,本文介绍国外新近出现的贝叶斯统计软件Stan的基本原理与实际使用。方法由于Stan安装具有其自身特点且较为复杂,本文首先介绍Windows平台下Stan安装与使用方法,接着介绍Stan语言及运行步骤,最后以线性-正态层次模型为例介绍Stan的应用。结果 Stan作为一种新型贝叶斯统计软件,使用了全新的汉密尔顿蒙托卡罗(Hamiltonian Monte Carlo,HMC)抽样方法,可以处理GIBBS抽样难以收敛的复杂多元层次模型。Stan使用的概率模型定义语言,相比较BUGS,逻辑清晰,程序更易理解。结论 Stan功能强大,应用方便,是贝叶斯分析的有力工具。展开更多
文摘随机对照试验(randomized controlled trial,RCT)一直被誉为药物临床疗效评估的金标准,但基于理想状态下开展的RCT及其得到的有效性证据,与临床实践存在一定差距,有时难以推断在存在并发症、伴随治疗等普遍情况下的风险和效益,其在临床实践中的外推性可能受限[1-3]。现实世界研究(real world study,RWS),又被称为真实世界研究,是一种RCT之外临床疗效评价的有益补充,近年来得到广泛重视。
文摘通过在基因组水平上对成千上万的单核苷酸多态性(single nucleotide polymorphism,SNP)进行系统性检测和分析,全基因组关联性研究(genome-wide association study,GWAS)发现了一系列与人类复杂性状和疾病(比如,身高、恶性肿瘤、糖尿病和高血压)相关的常见遗传变异位点[1-3]。
文摘目的比较深度森林联合模型、深度森林以及随机森林在医学影像数据分类中的预测性能。方法本研究提出深度森林联合模型,通过Sobol-MDA(Sobol-mean decrease accuracy)结合深度森林级联结构和随机森林的特征提取能力,对模拟实验和真实医学影像数据进行分析。模拟实验涵盖结局变量不均衡、变量间非线性关系、噪声变量、多重共线性及交互作用等场景。实例分析基于腮腺MRI数据,比较各模型在曲线下面积(area under curve,AUC)值等指标上的表现。结果在模拟实验以及实例分析中,深度森林联合模型表现优越,特别是在复杂交互作用场景下,其预测性能显著优于深度森林或随机森林模型。结论深度森林联合模型在应对复杂医学影像数据分类任务中具有显著优势,尤其在处理变量间存在高阶交互作用时,其预测性能优于深度森林。
文摘目的本研究旨在评价二代测序数据中关联性分析方法。以往运用于全基因组关联性研究(genome-wide association study,GWAS)中的方法能否在全外显子测序数据中有良好的精确度,对于未来测序数据的挖掘有重要的意义。方法利用英国生物样本库(UK biobank,UKB)45万人全外显子测序数据,模拟不同病例占比、不同亲缘关系占比的数据集,采用BOLT-LMM,SAIGE,fastGWA-GLMM和REGENIE四种常见的关联性分析算法对各种情景下的数据集进行模拟试验,评价指标主要是一类错误、运行时间和内存占用。根据不同情景下模拟试验结果,寻找效果最优的方法。结果SAIGE和REGENIE在各种情况下均能较好的控制一类错误,计算效率也较高。面对亲缘关系占比高,亲缘关系复杂的数据时,fastGWA-GLMM表现较差。BOLT-LMM不适用于二元表型,不推荐用于实际工作。结论综合比较,基于广义混合模型的SAIGE和基于机器学习的REGENIE适用于二代测序数据关联性分析。
文摘目的鉴于国内研究者熟悉的贝叶斯统计软件WinBUGS已停止更新,OpenBUGS已见介绍,本文介绍国外新近出现的贝叶斯统计软件Stan的基本原理与实际使用。方法由于Stan安装具有其自身特点且较为复杂,本文首先介绍Windows平台下Stan安装与使用方法,接着介绍Stan语言及运行步骤,最后以线性-正态层次模型为例介绍Stan的应用。结果 Stan作为一种新型贝叶斯统计软件,使用了全新的汉密尔顿蒙托卡罗(Hamiltonian Monte Carlo,HMC)抽样方法,可以处理GIBBS抽样难以收敛的复杂多元层次模型。Stan使用的概率模型定义语言,相比较BUGS,逻辑清晰,程序更易理解。结论 Stan功能强大,应用方便,是贝叶斯分析的有力工具。