期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
蛋白质中RNA-结合残基预测的随机森林模型 被引量:10
1
作者 马昕 郭静 孙啸 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第1期50-54,共5页
构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的... 构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的氨基酸理化特征.在设计模型时,考虑到样本数据量大的问题,选用了快速的随机森林算法.该预测模型总体预测准确率达到87.02%,特异性达到95.62%,敏感性达51.16%,Matthew相关系数为0.533 6.此外,还构建了RNA结合残基的预测平台. 展开更多
关键词 随机森林 位置特异性矩阵 嵌套式交叉验证 RNA-结合残基
在线阅读 下载PDF
均衡数据法提高蛋白质二级结构预测 被引量:1
2
作者 李伟 赵亚欧 陈月辉 《计算机工程与应用》 CSCD 北大核心 2009年第6期219-220,239,共3页
传统蛋白质二级结构预测,由于氨基酸序列中三种结构数量的差异,易造成不均衡训练,使得对三种结构的预测准确率差别较大。为改善这种缺陷,受装袋原理的启发,对传统方法进行改进,缩小训练时三种结构数量的差距。在实验中,采用数据集CB396... 传统蛋白质二级结构预测,由于氨基酸序列中三种结构数量的差异,易造成不均衡训练,使得对三种结构的预测准确率差别较大。为改善这种缺陷,受装袋原理的启发,对传统方法进行改进,缩小训练时三种结构数量的差距。在实验中,采用数据集CB396,结果表明该方法能够显著提高对折叠的预测正确率,而且在总的预测正确率上达到77.3%,可以较好地进行蛋白质二级结构预测。 展开更多
关键词 pssm矩阵 BP神经网络 CB396数据集 蛋白质二级结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部