目的利用生物软件和数据库对耐高温解淀粉芽孢杆菌BA-DES4的基因组数据进行处理、注释和分析,并在基因水平上对菌株特征进行功能注释。方法通过京都基因和基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)和基因本体论(ge...目的利用生物软件和数据库对耐高温解淀粉芽孢杆菌BA-DES4的基因组数据进行处理、注释和分析,并在基因水平上对菌株特征进行功能注释。方法通过京都基因和基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)和基因本体论(gene ontology,GO)等代谢信号通路,蛋白质同源组(clusters of orthologous groups of proteins,COG)、非冗余蛋白质(non-redundant protein,NR)数据库等分析,分别与预测得到的基因序列做比对,获得基因功能注释表。将预测得到基因的蛋白序列与COG、KEGG和GO数据库进行蛋白质序列对蛋白质序列库比对(basic local alignment search tool:protein,BLASTP)比对分析,从而实现基因注释信息预测及功能预测。结果通过数据库分析可知其碱基数目为4188731,GC含量占比为46.18%,编码的蛋白基因4445条,基因总长度为3696380 bp。对基因组蛋白编码基因进行功能注释可知,COG注释基因中占比最高的功能为G(碳水化合物的转运和代谢),其次为K(转录),表明COG数据库编码的蛋白基因主要参与细胞的基本功能。GO注释中,基因种类和数目最多的为生物学过程;碳水化合物活性酶(carbohydrate-active enzymes,CAZy)注释中,水解酶占比最高;KEGG注释中,碳水化合物代谢数目最多;在环境信息中,信息转导占比最多。耐高温解淀粉芽孢杆菌BA-DES4共11条编码纤维素酶的基因,β-葡萄糖苷酶和内切葡聚糖酶为基因编码的酶。结论本研究对耐高温解淀粉芽孢杆菌BA-DES4的基因组数据进行处理、注释和分析,进一步探索菌株研究潜力,以便更好地探究菌株产纤维素的调控机制,为后续实验提供理论基础。展开更多
文摘目的利用生物软件和数据库对耐高温解淀粉芽孢杆菌BA-DES4的基因组数据进行处理、注释和分析,并在基因水平上对菌株特征进行功能注释。方法通过京都基因和基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)和基因本体论(gene ontology,GO)等代谢信号通路,蛋白质同源组(clusters of orthologous groups of proteins,COG)、非冗余蛋白质(non-redundant protein,NR)数据库等分析,分别与预测得到的基因序列做比对,获得基因功能注释表。将预测得到基因的蛋白序列与COG、KEGG和GO数据库进行蛋白质序列对蛋白质序列库比对(basic local alignment search tool:protein,BLASTP)比对分析,从而实现基因注释信息预测及功能预测。结果通过数据库分析可知其碱基数目为4188731,GC含量占比为46.18%,编码的蛋白基因4445条,基因总长度为3696380 bp。对基因组蛋白编码基因进行功能注释可知,COG注释基因中占比最高的功能为G(碳水化合物的转运和代谢),其次为K(转录),表明COG数据库编码的蛋白基因主要参与细胞的基本功能。GO注释中,基因种类和数目最多的为生物学过程;碳水化合物活性酶(carbohydrate-active enzymes,CAZy)注释中,水解酶占比最高;KEGG注释中,碳水化合物代谢数目最多;在环境信息中,信息转导占比最多。耐高温解淀粉芽孢杆菌BA-DES4共11条编码纤维素酶的基因,β-葡萄糖苷酶和内切葡聚糖酶为基因编码的酶。结论本研究对耐高温解淀粉芽孢杆菌BA-DES4的基因组数据进行处理、注释和分析,进一步探索菌株研究潜力,以便更好地探究菌株产纤维素的调控机制,为后续实验提供理论基础。