-
题名生物序列模体的混合Gibbs抽样识别算法
被引量:2
- 1
-
-
作者
刘立芳
霍红卫
王宝树
-
机构
西安电子科技大学计算机学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2008年第4期750-755,共6页
-
基金
国家自然科学基金(No.60705004)
陕西省自然科学基金(No.2005F33)
-
文摘
针对生物序列模体的识别问题,提出了一个新的混合Gibbs抽样识别算法.算法基于混合模体模型学习,采用贪心策略,通过似然度最大化,逐次将新的模体加入到混合模型中.算法中设计了位点抽样和模体抽样两种抽样方法,这两种抽样方法交替进行.为了加速搜索过程,对输入数据集采用了基于kd-trees的分层划分策略.实验结果表明,该算法对序列家族大量模体特征的识别具有显著优势,并且可建立更具统计特征的模体模型,从而提高序列分类的准确性.
-
关键词
生物信息学
模体识别
GIBBS抽样
混合模体模型
-
Keywords
bioinformatics
motif discovery
Gibbs sampling
mixture motifs model
-
分类号
Q811.4
[生物学—生物工程]
TP301.6
[自动化与计算机技术—计算机系统结构]
-