期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
人类基因组非冗余Exon/Intron数据库的构建
1
作者 罗冬梅 金鹰 +1 位作者 邓小元 刘海 《华南师范大学学报(自然科学版)》 CAS 北大核心 2010年第4期87-92,共6页
以Homo.sapiensRefSeq作为原始数据库来构建EID(Exon/Intron Database)可以克服GenBank所带来的冗余问题.通过分析RefSeq基因组数据库中每个CDS(Coding Sequence,编码序列),获得构建EID的相关的数据(基因的定义、基因标识符、基因序列... 以Homo.sapiensRefSeq作为原始数据库来构建EID(Exon/Intron Database)可以克服GenBank所带来的冗余问题.通过分析RefSeq基因组数据库中每个CDS(Coding Sequence,编码序列),获得构建EID的相关的数据(基因的定义、基因标识符、基因序列、蛋白质标识符、蛋白质序列、外显子和内含子的数量、大小、总数、非翻译区(UTR)内含子、内含子相位、内含子剪切位点模式).结果表明,人类24条染色体(22条常染色体和2条性染色体,共计2 870 827355 bps)中含有32 157个基因标识符(gene blocks),其中7 398个基因为假基因,4 014个基因发生了可变剪切(Al-ternative Splicing,AS),15 533个基因含有CDS内含子,765个基因含有UTR内含子,2 585个基因不含有内含子,其他的为异常基因. 展开更多
关键词 非冗余外显子/内含子数据库 RefSeq Homo.sapiens 编码序列 非翻译区
在线阅读 下载PDF
GenBank中CDS..join特征域研究初步 被引量:2
2
作者 金鹰 《华南师范大学学报(自然科学版)》 CAS 2008年第2期95-99,共5页
由NCBI建立和维护的大型公用数据库GenBank是进行生物学研究最为重要的工具之一.其DNA序列数据库的每条记录描述了相关基因的详细特征,其中的CDS(Coding Sequence)特征域被认为是DNA生成蛋白质的翻译指令,它对GenBank中每条基因的组装... 由NCBI建立和维护的大型公用数据库GenBank是进行生物学研究最为重要的工具之一.其DNA序列数据库的每条记录描述了相关基因的详细特征,其中的CDS(Coding Sequence)特征域被认为是DNA生成蛋白质的翻译指令,它对GenBank中每条基因的组装进行了详细的说明.通过CDS可以很容易在互联网上进行多序列搜索,并获得相关的基因序列、编码蛋白序列及种属特异性信息.利用CDS特征域构建外显子-内含子数据库(Exon-Intron Database,EID)是研究内含子起源、进化和功能的重要手段,本文试图以CDS为线索,解决建库初期从GenBank海量数据中提取相关序列的问题. 展开更多
关键词 GENBANK 编码序列 外显子 内含子 EID
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部