蛋白质二级结构预测是公认的生物信息学领域的国际性难题。以基于内在认知机理的知识发现理论(knowledge discovery theory based on inner cognitive mechanism,KDTICM)理论的扩展性研究与数据库中的知识发现(knowledge discovery in d...蛋白质二级结构预测是公认的生物信息学领域的国际性难题。以基于内在认知机理的知识发现理论(knowledge discovery theory based on inner cognitive mechanism,KDTICM)理论的扩展性研究与数据库中的知识发现(knowledge discovery in database*,KDD*)模型为基础,提出一种基于结构序列的多分类算法——SAC(structuralassociation classification),可以有效地解决蛋白质二级结构预测问题。该算法借助设定支持度阈值的精化知识库的方法,其预测准确率能够超过85%。以该算法为核心,构建了一个蛋白质二级预测模型——复合金字塔模型。实验证明,在RS126、CB513I、LP数据集上的预测准确率均超过80%,超过目前已知的国际主流水平。展开更多
为解决SVM、Bayes、RNN(recurrent neural network)等传统算法在蛋白质结构分类任务中精度低的问题,提出一种基于残差网络的蛋白质超二级结构图像分类方法。将PDB(protein data bank)和SCOP(structural classification of proteins)数...为解决SVM、Bayes、RNN(recurrent neural network)等传统算法在蛋白质结构分类任务中精度低的问题,提出一种基于残差网络的蛋白质超二级结构图像分类方法。将PDB(protein data bank)和SCOP(structural classification of proteins)数据库中的4类蛋白质超二级结构3D模型转化为14角度拍摄的2D图像,针对每类图像,通过残差网络单元进行深度特征提取和优化,利用神经网络模型训练,将验证精度最高的模型保存下来并进行测试。实验结果表明,分类精度达到了90.2%,验证了模型的可行性和算法的有效性。展开更多
文摘蛋白质二级结构预测是公认的生物信息学领域的国际性难题。以基于内在认知机理的知识发现理论(knowledge discovery theory based on inner cognitive mechanism,KDTICM)理论的扩展性研究与数据库中的知识发现(knowledge discovery in database*,KDD*)模型为基础,提出一种基于结构序列的多分类算法——SAC(structuralassociation classification),可以有效地解决蛋白质二级结构预测问题。该算法借助设定支持度阈值的精化知识库的方法,其预测准确率能够超过85%。以该算法为核心,构建了一个蛋白质二级预测模型——复合金字塔模型。实验证明,在RS126、CB513I、LP数据集上的预测准确率均超过80%,超过目前已知的国际主流水平。
文摘为解决SVM、Bayes、RNN(recurrent neural network)等传统算法在蛋白质结构分类任务中精度低的问题,提出一种基于残差网络的蛋白质超二级结构图像分类方法。将PDB(protein data bank)和SCOP(structural classification of proteins)数据库中的4类蛋白质超二级结构3D模型转化为14角度拍摄的2D图像,针对每类图像,通过残差网络单元进行深度特征提取和优化,利用神经网络模型训练,将验证精度最高的模型保存下来并进行测试。实验结果表明,分类精度达到了90.2%,验证了模型的可行性和算法的有效性。