期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于ELMC的蛋白质折叠识别方法
1
作者 唐立力 《计算机工程与应用》 CSCD 2013年第10期114-117,共4页
传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳参数,利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,... 传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳参数,利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,仅需调节很少的参数值就可达到很好的测试精度。与支持向量机(Support Vector Machine,SVM)和推荐相关向量机(Relevance Vector Machine,RVM)相比,ELMC能获得更好的泛化性能,而且在寻找最优解的训练时间比较上,ELMC比SVM平均要快35倍,比RVM要快12倍。 展开更多
关键词 蛋白质折叠识别 ELM分类优化方法 多类分类
在线阅读 下载PDF
拟南芥中PAP特异磷酸酶(AtAHL)的折叠识别与结构预测
2
作者 彭艺 曾宗浩 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2003年第4期566-573,共8页
通过现有的序列同源性比较、二级结构预测、三维结构预测和模拟方法 ,得到了拟南芥中PAP特异磷酸酶的三维结构 .这是一种与酵母中的Hal2 p蛋白质类似 ,并且N端为α +β ,C端为α/ β结构域的多结构域蛋白质 .分析预测所得结构 ,发现了Mg... 通过现有的序列同源性比较、二级结构预测、三维结构预测和模拟方法 ,得到了拟南芥中PAP特异磷酸酶的三维结构 .这是一种与酵母中的Hal2 p蛋白质类似 ,并且N端为α +β ,C端为α/ β结构域的多结构域蛋白质 .分析预测所得结构 ,发现了Mg2 + 等金属离子的结合位点 ,推测了对Na+ 敏感的结构基础 .这些结合位点与其生化功能相关 .而且 ,通过结构与功能分析 ,讨论了蛋白质数据库 (PDB) 展开更多
关键词 拟南芥 PAP特异磷酸酶 折叠识别 蛋白质 三维结构 结构预测
在线阅读 下载PDF
基于折叠识别法的蛋白质天然构象的一致性预测法Pcons2与聚类分析的理论研究 被引量:1
3
作者 方慧生 王旻 余江河 《中国药科大学学报》 CAS CSCD 北大核心 2006年第1期77-82,共6页
在蛋白质天然构象预测中,折叠识别法中一致性预测Pcons2和从头预测法中的Rosetta在CASP5中获得了很大的成功。在Rosetta法中,先用Monte Carlo搜索法产生大量低能量的预测模型,然后依据模型之间相似性分数,用聚类分析法选择质量好的模型... 在蛋白质天然构象预测中,折叠识别法中一致性预测Pcons2和从头预测法中的Rosetta在CASP5中获得了很大的成功。在Rosetta法中,先用Monte Carlo搜索法产生大量低能量的预测模型,然后依据模型之间相似性分数,用聚类分析法选择质量好的模型。而Pcons2则是基于线性回归来预测模型的质量。人们通常认为Pcons2和聚类分析是两个完全不同的方法。本文通过理论研究和实际数据计算发现:在聚类分析中,模型之间的相似性分数与模型质量存在着较强的线性关系,这也是聚类分析的工作基础。因此,如果不考虑预测模型的来源,聚类分析和Pcons2的基本原理和算法是相同的。据此可以将Pcons2中的优势转移到聚类分析中,为从头预测最终选择较高质量的模型提供一些新途径。 展开更多
关键词 蛋白质结构预测 折叠识别 Pcons2 聚类分析 CASP
在线阅读 下载PDF
蛋白质折叠类型的分类建模与识别 被引量:8
4
作者 刘岳 李晓琴 +1 位作者 徐海松 乔辉 《物理化学学报》 SCIE CAS CSCD 北大核心 2009年第12期2558-2564,共7页
蛋白质的氨基酸序列如何决定空间结构是当今生命科学研究中的核心问题之一.折叠类型反映了蛋白质核心结构的拓扑模式,折叠识别是蛋白质序列-结构研究的重要内容.我们以占Astral 1.65序列数据库中α,β和α/β三类蛋白质总量41.8%的36个... 蛋白质的氨基酸序列如何决定空间结构是当今生命科学研究中的核心问题之一.折叠类型反映了蛋白质核心结构的拓扑模式,折叠识别是蛋白质序列-结构研究的重要内容.我们以占Astral 1.65序列数据库中α,β和α/β三类蛋白质总量41.8%的36个无法独立建模的折叠类型为研究对象,选取其中序列一致性小于25%的样本作为训练集,以均方根偏差(RMSD)为指标分别进行系统聚类,生成若干折叠子类,并对各子类建立基于多结构比对算法(MUSTANG)结构比对的概形隐马尔科夫模型(profile-HMM).将Astral 1.65中序列一致性小于95%的9505个样本作为检验集,36个折叠类型的平均识别敏感性为90%,特异性为99%,马修斯相关系数(MCC)为0.95.结果表明:对于成员较多,无法建立统一模型的折叠类型,基于RMSD的系统分类建模均可实现较高准确率的识别,为蛋白质折叠识别拓展了新的方法和思路,为进一步研究奠定了基础. 展开更多
关键词 蛋白质折叠类型 均方根偏差 系统聚类 隐马尔科夫模型 折叠识别
在线阅读 下载PDF
极限学习机优化方法在蛋白质折叠类型识别中的应用
5
作者 张志锋 范乃梅 《科学技术与工程》 北大核心 2013年第11期3002-3005,3011,共5页
传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳的参数。利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识... 传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳的参数。利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,仅需调节很少的参数值就可达到很好的测试精度。与支持向量机(Support Vector Machine,SVM)和推荐相关向量机(Relevance Vector Machine,RVM)相比,ELMC能获得更好的泛化性能,而且在寻找最优解的训练时间比较上,ELMC比SVM平均要快35倍,比RVM要快12倍。 展开更多
关键词 蛋白质折叠识别 ELM分类优化方法 多类分类
在线阅读 下载PDF
基于功能域组分的蛋白质折叠类型识别 被引量:3
6
作者 闫金丽 陈治伟 +1 位作者 徐海松 李晓琴 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2011年第2期166-172,共7页
蛋白质空间结构研究是分子生物学、细胞生物学、生物化学以及药物设计等领域的重要课题.折叠类型反映了蛋白质核心结构的拓扑模式,对折叠类型的识别是蛋白质序列与结构关系研究的重要内容.选取LIFCA数据库中样本量较大的53种折叠类型,... 蛋白质空间结构研究是分子生物学、细胞生物学、生物化学以及药物设计等领域的重要课题.折叠类型反映了蛋白质核心结构的拓扑模式,对折叠类型的识别是蛋白质序列与结构关系研究的重要内容.选取LIFCA数据库中样本量较大的53种折叠类型,应用功能域组分方法进行折叠识别.将Astral 1.65中序列一致性小于95%的样本作为检验集,全库检验结果中平均敏感性为96.42%,特异性为99.91%,马修相关系数(MCC)为0.91,各项统计结果表明:功能域组分方法可以很好地应用在蛋白质折叠识别中,LIFCA相对简单的分类规则可以很好地集中蛋白质的大部分功能特性,反映了结构与功能的对应关系. 展开更多
关键词 折叠类型 折叠识别 功能域 LIFCA数据库
在线阅读 下载PDF
基于支持向量机融合网络的蛋白质折叠子识别研究 被引量:19
7
作者 施建宇 潘泉 +1 位作者 张绍武 梁彦 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2006年第2期155-162,共8页
在不依赖于序列相似性的条件下,蛋白质折叠子识别是一种分析蛋白质结构的重要方法.提出了一种三层支持向量机融合网络,从蛋白质的氨基酸序列出发,对27类折叠子进行识别.融合网络使用支持向量机作为成员分类器,采用“多对多”的多类分类... 在不依赖于序列相似性的条件下,蛋白质折叠子识别是一种分析蛋白质结构的重要方法.提出了一种三层支持向量机融合网络,从蛋白质的氨基酸序列出发,对27类折叠子进行识别.融合网络使用支持向量机作为成员分类器,采用“多对多”的多类分类策略,将折叠子的6种特征分为主要特征和次要特征,构建了多个差异的融合方案,然后对这些融合方案进行动态选择得到最终决策.当分类之前难以确定哪些参与组合的特征种类能够使分类结果最好时,提供了一种可靠的解决方案来自动选择特征信息互补最大的组合,保证了最佳分类结果.最后,识别系统对独立测试样本的总分类精度达到61.04%.结果和对比表明,此方法是一种有效的折叠子识别方法. 展开更多
关键词 折叠识别 支持向量机 分类器融合 动态选择
在线阅读 下载PDF
Globin-like蛋白质折叠类型识别 被引量:8
8
作者 任文科 徐海松 李晓琴 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2008年第5期548-554,共7页
蛋白质折叠类型识别是蛋白质结构研究的重要内容.以SCOP中的Globin-like折叠为研究对象,选择其中序列同一性小于25%的17个代表性蛋白质为训练集,采用机器和人工结合的办法进行结构比对,产生序列排比,经过训练得到了适合Globin-like折叠... 蛋白质折叠类型识别是蛋白质结构研究的重要内容.以SCOP中的Globin-like折叠为研究对象,选择其中序列同一性小于25%的17个代表性蛋白质为训练集,采用机器和人工结合的办法进行结构比对,产生序列排比,经过训练得到了适合Globin-like折叠的概形隐马尔科夫模型(profile HMM)用于该折叠类型的识别.以Astral1.65中的68057个结构域样本进行检验,识别敏感度为99.64%,特异性100%.在折叠类型水平上,与Pfam和SUPERFAMILY单纯使用序列比对构建的HMM相比,所用模型由多于100个归为一个,仍然保持了很高的识别效果.结果表明:对序列相似度很低但具有相同折叠类型的蛋白质,可以通过引入结构比对的方法建立统一的HMM模型,实现高准确率的折叠类型识别. 展开更多
关键词 蛋白质 折叠类型识别 Globin-like 隐马尔科夫模型 结构比对
在线阅读 下载PDF
利用隐马尔科夫模型识别蛋白质折叠类型
9
作者 李晓琴 仁文科 刘岳 《北京工业大学学报》 EI CAS CSCD 北大核心 2011年第7期1103-1109,共7页
以70种蛋白质折叠为研究对象,对每种折叠,选择序列同一性小于25%、样本量大于3的代表性蛋白质为训练集,采用机器和人工结合的办法进行结构比对,产生序列排比,经过训练得到了适合每种折叠的概形隐马尔科夫模型(profile HMM)用于该折叠类... 以70种蛋白质折叠为研究对象,对每种折叠,选择序列同一性小于25%、样本量大于3的代表性蛋白质为训练集,采用机器和人工结合的办法进行结构比对,产生序列排比,经过训练得到了适合每种折叠的概形隐马尔科夫模型(profile HMM)用于该折叠类型的识别.对Astral1.65中的9 505个蛋白质结构域样本进行单模型识别,平均敏感性和特异性分别为91.93%和99.95%,Matthew相关系数为0.87.在折叠类型水平上,与Pfam和SUPERFAMILY单纯使用序列比对构建的HMM相比,所用模型数量显著减少,仍然保持很高的识别效果.结果表明:对序列相似度很低但具有相同折叠类型的蛋白质,可以通过引入结构比对的方法建立统一的HMM模型,实现高准确率的折叠类型识别. 展开更多
关键词 蛋白质 折叠类型识别 隐马尔科夫模型 结构比对
在线阅读 下载PDF
基于卷积神经网络的蛋白质折叠类型最小特征提取 被引量:1
10
作者 潘越 王骏 +2 位作者 李文飞 张建 王炜 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期744-753,共10页
通过蛋白质的序列、结构等信息构建完整的蛋白质宇宙是生物信息学中的重要课题,相关研究对蛋白质结构预测、蛋白质进化路径分析以及蛋白质结构设计等方面的研究都有重要的意义.从蛋白质结构的一种简化表示——蛋白质接触图出发,通过训... 通过蛋白质的序列、结构等信息构建完整的蛋白质宇宙是生物信息学中的重要课题,相关研究对蛋白质结构预测、蛋白质进化路径分析以及蛋白质结构设计等方面的研究都有重要的意义.从蛋白质结构的一种简化表示——蛋白质接触图出发,通过训练卷积神经网络进行特征提取,筛选出可识别结构域折叠类型的最小特征向量,构建蛋白质折叠类型空间,并使用谱聚类等方法对不同蛋白质折叠类型的高维分布情况进行分析.得到的最小特征向量兼顾了信息的完整性与冗余度,可以很好地表示全部七种常见蛋白质类的空间关联.该研究结果填补了之前蛋白质宇宙研究中对不常见类的空间位置和相互关系描述的空白,加深了对于蛋白质结构相似性的理解. 展开更多
关键词 蛋白质宇宙 深度学习 卷积神经网络 蛋白质折叠类型识别
在线阅读 下载PDF
蛋白质天然构象预测的研究进展 被引量:4
11
作者 方慧生 吴梧桐 +2 位作者 王旻 余江河 郑珩 《中国药科大学学报》 CAS CSCD 北大核心 2005年第3期195-200,共6页
继人类基因组计划完成后,如何弄清相应的基因序列的功能及其之间的关系,即比较彻底地解开生命的奥秘成为后基因组计划的主要任务。基因的功能最终主要通过蛋白质来完成,因此,如何根据已知的氨基酸序列来预测相应的蛋白质天然构象成为后... 继人类基因组计划完成后,如何弄清相应的基因序列的功能及其之间的关系,即比较彻底地解开生命的奥秘成为后基因组计划的主要任务。基因的功能最终主要通过蛋白质来完成,因此,如何根据已知的氨基酸序列来预测相应的蛋白质天然构象成为后基因组计划中最重要的组成部分之一,这为比较彻底界定其功能奠定分子生物学基础。本文从以下几个方面进行了详细地介绍:(1)组成蛋白质天然构象预测方法的基本元素即序列比对方法、构象空间搜索方法及有关的蛋白质数据库;(2)结构预测方法的评估与分类;(3)描述预测性能较好及有比较发展前景的预测方法;(4)天然构象预测的前景等。 展开更多
关键词 蛋白质天然构象预测 CASP 从头预测 折叠识别
在线阅读 下载PDF
蛋白质结构的预测及其应用 被引量:9
12
作者 宁正元 林世强 《福建农林大学学报(自然科学版)》 CSCD 北大核心 2006年第3期308-313,共6页
蛋白质结构的预测是结构基因组学的重要研究内容,本文就蛋白质结构预测的方法和应用进行了综述,介绍了比较建模、折叠识别、从头计算等3种方法及其在结构基因组学研究、药物设计、蛋白质设计中的应用,并且对蛋白质结构预测存在的主要问... 蛋白质结构的预测是结构基因组学的重要研究内容,本文就蛋白质结构预测的方法和应用进行了综述,介绍了比较建模、折叠识别、从头计算等3种方法及其在结构基因组学研究、药物设计、蛋白质设计中的应用,并且对蛋白质结构预测存在的主要问题进行了讨论,指出了今后蛋白质结构预测研究重点在于优化比对算法和计分函数以及膜蛋白的结构预测. 展开更多
关键词 蛋白质结构 比较建模 折叠识别 从头计算
在线阅读 下载PDF
低同源性蛋白质结构预测 被引量:2
13
作者 倪立生 毛凤楼 +1 位作者 韩玉真 来鲁华 《物理化学学报》 SCIE CAS CSCD 北大核心 2001年第5期389-392,共4页
The development of human genome project calls for more rapid and accurate protein structure prediction method to assign the structure and function of gene products. Threading has been proved to be successful in protei... The development of human genome project calls for more rapid and accurate protein structure prediction method to assign the structure and function of gene products. Threading has been proved to be successful in protein fold assignment,although difficulties remain for low homologous sequences. We have developed a method for solving the sequence rearrangement problem in threading. By reshuffling secondary elements,protein structures with the same spatial arrangement of secondary structures but different connections can be predicted. This method has been proved to be useful in fold recognition for proteins of different evolutionary origin and converge to the same fold. 展开更多
关键词 蛋白质 结构预测 折叠模式识别 低同源性 收敛进化 基因组 二级结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部