序列拼接是生物信息学的基础问题.全面总结了面向下一代测序技术的de novo DNA序列拼接工具,介绍下一代测序平台产生的数据特点以及de novo序列拼接算法所面临的挑战;给出序列拼接算法的形式化定义,总结目前最常用的拼接策略以及根据相...序列拼接是生物信息学的基础问题.全面总结了面向下一代测序技术的de novo DNA序列拼接工具,介绍下一代测序平台产生的数据特点以及de novo序列拼接算法所面临的挑战;给出序列拼接算法的形式化定义,总结目前最常用的拼接策略以及根据相应策略开发的拼接工具的特点和实现细节;对评估拼接性能的主要参数进行描述,并通过不同物种、不同规模的真实基因组序列数据对多个具有代表性的拼接工具进行测试,比较它们的拼接性能以验证相应的工具特点.为研究人员提供工具选择指导或改善拼接工具性能提供帮助;最后总结并阐述序列拼接工具存在的问题和发展趋势.展开更多
目的:探讨少肌症主要表型瘦体重(Lean body mass,LBM)和初潮年龄(Age at menarche,AAM)潜在的多微效基因。方法:随机选择白种人女性1 692作为研究样本,随机选择中国女性801名作为验证样本。采用Affymetrix公司的Genome-Wide Human SNP A...目的:探讨少肌症主要表型瘦体重(Lean body mass,LBM)和初潮年龄(Age at menarche,AAM)潜在的多微效基因。方法:随机选择白种人女性1 692作为研究样本,随机选择中国女性801名作为验证样本。采用Affymetrix公司的Genome-Wide Human SNP Array 6.0芯片套装,对研究样本和验证样本的909、622 SNP进行基因分型,然后对四肢LBM和AAM进行双变量全基因组关联分析。结果:研究发现双变量GWAS鉴定的SNP rs1860547和rs11030746在双变量GWA分析中全基因组水平非常显著,经过验证P<0.05,在SNP rs1860547上游发现对LBM和AAM具有重要影响的KCNA1和KCNA5基因,在SNP rs11030746下游发现KCNA4基因。单变量GWAS鉴定的SNP rs1860547和rs11030746全基因组水平非常显著,经过验证P<0.05,在SNP rs1860547上游发现对LBM具有重要影响的KCNA1和KCNA5基因,在SNP rs11030746下游发现KCNA4基因。结论:白种人女性中KCNA1、KCNA4、KCNA5基因可能是LBM和AAM密切相关的多微效基因。展开更多
文摘序列拼接是生物信息学的基础问题.全面总结了面向下一代测序技术的de novo DNA序列拼接工具,介绍下一代测序平台产生的数据特点以及de novo序列拼接算法所面临的挑战;给出序列拼接算法的形式化定义,总结目前最常用的拼接策略以及根据相应策略开发的拼接工具的特点和实现细节;对评估拼接性能的主要参数进行描述,并通过不同物种、不同规模的真实基因组序列数据对多个具有代表性的拼接工具进行测试,比较它们的拼接性能以验证相应的工具特点.为研究人员提供工具选择指导或改善拼接工具性能提供帮助;最后总结并阐述序列拼接工具存在的问题和发展趋势.
文摘目的:探讨少肌症主要表型瘦体重(Lean body mass,LBM)和初潮年龄(Age at menarche,AAM)潜在的多微效基因。方法:随机选择白种人女性1 692作为研究样本,随机选择中国女性801名作为验证样本。采用Affymetrix公司的Genome-Wide Human SNP Array 6.0芯片套装,对研究样本和验证样本的909、622 SNP进行基因分型,然后对四肢LBM和AAM进行双变量全基因组关联分析。结果:研究发现双变量GWAS鉴定的SNP rs1860547和rs11030746在双变量GWA分析中全基因组水平非常显著,经过验证P<0.05,在SNP rs1860547上游发现对LBM和AAM具有重要影响的KCNA1和KCNA5基因,在SNP rs11030746下游发现KCNA4基因。单变量GWAS鉴定的SNP rs1860547和rs11030746全基因组水平非常显著,经过验证P<0.05,在SNP rs1860547上游发现对LBM具有重要影响的KCNA1和KCNA5基因,在SNP rs11030746下游发现KCNA4基因。结论:白种人女性中KCNA1、KCNA4、KCNA5基因可能是LBM和AAM密切相关的多微效基因。