期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
Learning to Predict in Complex Biological Domains
1
作者 Steven Eschrich Nitesh V.Chawla Lawrence O.Hall 《系统仿真学报》 CAS CSCD 2002年第11期1464-1471,共8页
Protein secondary structure prediction and high-throughput drug screen data mining are two important applications in bioinformatics. The data is represented in sparse feature spaces and can be unrepresentative of futu... Protein secondary structure prediction and high-throughput drug screen data mining are two important applications in bioinformatics. The data is represented in sparse feature spaces and can be unrepresentative of future data. There is certainly some noise in the data and there may be significant noise. Supervised learners in this context will display their inherent bias toward certain solutions, generally solutions that fit the training set well. In this paper, we first describe an ensemble approach using subsampling that scales well with dataset size. A sufficient number of ensemble members using subsamples of the data can yield a more accurate classifier than a single classifier using the entire dataset. Experiments on several datasets demonstrate the effectiveness of the approach. We report results from the KDD Cup 2001 drug discovery dataset in which our approach yields a higher weighted accuracy than the winning entry. We then ex-tend our ensemble approach to create an over-generalized classifier for prediction by reducing the individual subsample size. The ensemble strategy using small subsamples has the effect of averaging over a wider range of hypotheses. We show that both protein secondary structure prediction and drug discovery prediction can be improved by the use of over-generalization, specifically through the use of ensembles of small subsamples. 展开更多
关键词 生物信息学 蛋白质再生结构 DNA 系统方法
在线阅读 下载PDF
基于混合SVM方法的蛋白质二级结构预测算法 被引量:4
2
作者 隋海峰 曲武 +1 位作者 钱文彬 杨炳儒 《计算机科学》 CSCD 北大核心 2011年第10期169-173,188,共6页
预测蛋白质二级结构,是当今生物信息学中一个难以解决的问题。由于预测蛋白质二级结构的精度在蛋白质结构研究中起到非常重要的作用,因此在基于KDTICM理论基础上,提出一种基于混合SVM方法的蛋白质二级结构预测算法。该算法有效地利用蛋... 预测蛋白质二级结构,是当今生物信息学中一个难以解决的问题。由于预测蛋白质二级结构的精度在蛋白质结构研究中起到非常重要的作用,因此在基于KDTICM理论基础上,提出一种基于混合SVM方法的蛋白质二级结构预测算法。该算法有效地利用蛋白质的物化属性和PSI-SEARCH生成的位置特异性打分矩阵作为双层SVM的输入,从而大大地提高了蛋白质二级结构预测的精度。实验比较分析表明,新算法的预测精度和普适性明显优于目前其他典型的预测方法。 展开更多
关键词 蛋白质二级结构预测 混合sVM方法 复合金字塔模型
在线阅读 下载PDF
基于SQL Server的蛋白质二级结构预测样本集数据库的构建 被引量:2
3
作者 张宁 吴捷 +1 位作者 宋卓 张涛 《高技术通讯》 CAS CSCD 北大核心 2006年第6期619-623,共5页
基于SQL Server数据库管理系统,将蛋白质二级结构预测的样本集CB513、CB396和RS126组织起来,建立了数据库DataSet,并配置了一个IIS服务器以方便网络查询。该数据库将蛋白质二级结构预测样本集有效地组织起来,实现了规范化、结构化... 基于SQL Server数据库管理系统,将蛋白质二级结构预测的样本集CB513、CB396和RS126组织起来,建立了数据库DataSet,并配置了一个IIS服务器以方便网络查询。该数据库将蛋白质二级结构预测样本集有效地组织起来,实现了规范化、结构化统一管理,便于存储、检索和分析数据,减少错误的发生。通过该数据库可以提取供蛋白质二级结构预测研究的样本、序列转换、变换编码以及分析评价预测结果等,取代许多传统编程处理文本文件的繁琐工作,大大提高效率,促进工作的开展。 展开更多
关键词 数据库 蛋白质二级结构预测 样本集 sQL sERVER 生物信息学
在线阅读 下载PDF
优化多核SVM的蛋白质二级结构预测 被引量:2
4
作者 刘斌 温雪岩 《现代电子技术》 北大核心 2020年第8期139-142,共4页
蛋白质序列的不同特征提取方式对蛋白质结构分类有很大的影响。为更好地表达蛋白质结构信息,基于特征融合思想构建特征向量,并使用一种基于多核支持向量机的方法,以多个核函数的线性加权代替传统的单一核函数,在对多类特征进行整合后构... 蛋白质序列的不同特征提取方式对蛋白质结构分类有很大的影响。为更好地表达蛋白质结构信息,基于特征融合思想构建特征向量,并使用一种基于多核支持向量机的方法,以多个核函数的线性加权代替传统的单一核函数,在对多类特征进行整合后构造SimpleMKL分类模型;利用梯度下降法迭代求解核函数的权值系数,并校准核函数参数和不同特征表达的融合效果。实验结果表明,该方法提高了蛋白质二级结构分类精度,在分类精度方面有明显优势,有助于准确预测蛋白质的二级结构。 展开更多
关键词 蛋白质 二级结构预测 多核支持向量机 特征提取 特征融合 线性加权
在线阅读 下载PDF
百脉根Hsp70s基因家族的生物信息学分析 被引量:8
5
作者 杨芳 杨仕梅 +2 位作者 罗雪 吴佳海 宋莉 《山地农业生物学报》 2020年第5期1-8,共8页
热激蛋白(HSPs)是细胞受逆境诱导产生的一类具有稳定蛋白质结构、修复变性蛋白和维护生物膜稳定等功能的分子伴侣,同时,在缓解植物高温伤害和提高热耐受性等方面有重要的调控作用。根据百脉根基因组数据,利用生物信息学方法对百脉根Hsp7... 热激蛋白(HSPs)是细胞受逆境诱导产生的一类具有稳定蛋白质结构、修复变性蛋白和维护生物膜稳定等功能的分子伴侣,同时,在缓解植物高温伤害和提高热耐受性等方面有重要的调控作用。根据百脉根基因组数据,利用生物信息学方法对百脉根Hsp70基因(LjHsp70s)家族的基因结构、染色体分布、选择压力、顺式作用元件、表达特性和系统进化等进行分析。结果表明,LjHsp70s家族有18个成员,分为4类,它们的内含子和外显子数量为1~8,含有多个保守基序,分布在6条染色体上,编码602~703个氨基酸,均编码酸性亲水蛋白;含有激素、光照及胁迫等响应顺式作用元件,LjHsp70s在百脉根的根、茎、叶等部位均有表达,但其表达量不同;该家族基因在进化过程中主要受负选择作用,进化上较为保守,家族成员与拟南芥和烟草的Hsp70基因可分为6组,但是百脉根LjHsp70s基因仅存在于4个亚族中,表明其与拟南芥、烟草的Hsp70s基因家族成员之间进化关系密切,同时也存在一定差异。LjHsp70s基因在百脉根的各个部位均有表达,对百脉根生长发育过程起着重要的作用,研究结果为解析百脉根LjHsp70s基因功能提供了依据。 展开更多
关键词 百脉根 LiHsp70s基因结构 热激蛋白 生物信息学 功能预测
在线阅读 下载PDF
嗜酸性乳杆菌MG株S层蛋白的高级结构预测分析及原核表达
6
作者 王敏 小琴 +4 位作者 那日苏 王彩凤 特尼格尔 赵慧 格日勒图 《动物医学进展》 CSCD 北大核心 2013年第4期18-22,共5页
以嗜酸性乳杆菌MG株slp基因(表达S层蛋白的基因)为材料,应用Genetyx软件推导出其正确的开放阅读框(ORF),并用CPHmodels,Swiss-Model和Swiss-PdbViewer生物软件预测SLP蛋白质的高级结构;此外,构建slp基因的原核表达载体pGEX-slp,经IPTG... 以嗜酸性乳杆菌MG株slp基因(表达S层蛋白的基因)为材料,应用Genetyx软件推导出其正确的开放阅读框(ORF),并用CPHmodels,Swiss-Model和Swiss-PdbViewer生物软件预测SLP蛋白质的高级结构;此外,构建slp基因的原核表达载体pGEX-slp,经IPTG诱导后,成功表达出重组S层蛋白(S-layer protein,SLP),并进行SDS-PAGE和Western blot鉴定。结果表明,使用3种不同的软件预测SLP蛋白质的高级结构,预测结果具有很高的相似性,其中α螺旋占3.33%,线性结构占45%,无规则卷曲占51.67%,平均亲水值为-0.262,亲水氨基酸比例为59.1%;表达载体pGEX-slp在E.coli BL21中经IPTG诱导成功表达出重组SLP蛋白,其GST融合蛋白的大小约为70ku。本研究结果为进一步以SLP为材料的生物制品的制备和应用开发奠定了基础。 展开更多
关键词 嗜酸性乳杆菌MG株 s层蛋白 高级结构预测 原核表达
在线阅读 下载PDF
基于二维相关红外光谱对pH值影响大豆分离蛋白二级结构含量的快速分析 被引量:2
7
作者 刘畅 吴丹丹 +4 位作者 王宁 王睿莹 王立琦 刘峰 于殿宇 《食品科学》 EI CAS CSCD 北大核心 2024年第17期26-34,共9页
为满足不同种类食品对大豆分离蛋白(soybean protein isolate,SPI)不同功能性的需求,本研究利用红外光谱快速采集70组不同pH值处理后SPI的数据,探讨pH值变化对SPI结构含量的影响。使用均值中心化、多元散射校正、标准正态变量变换和归... 为满足不同种类食品对大豆分离蛋白(soybean protein isolate,SPI)不同功能性的需求,本研究利用红外光谱快速采集70组不同pH值处理后SPI的数据,探讨pH值变化对SPI结构含量的影响。使用均值中心化、多元散射校正、标准正态变量变换和归一化算法对红外光谱数据进行预处理,基于二维相关红外光谱提取特征波段,再利用偏最小二乘(partial least square,PLS)法和算术优化算法-随机森林(arithmetic optimization algorithm-random forests,AOA-RF)建立不同pH值条件下SPI结构及含量的预测模型。结果表明,经均值中心化和多元散射校正结合处理后,α-螺旋、β-折叠、β-转角和无规卷曲模型的相对标准偏差分别为1.29%、1.60%、1.37%、7.28%,两者结合对光谱数据的预处理效果最佳。预测α-螺旋和β-折叠含量最优模型为AOA-RF(特征波段),校正集决定系数为0.9350和0.9266,预测集决定系数为0.8568和0.8701;预测β-转角和无规卷曲含量最优模型为PLS(特征波段),校正集决定系数为0.9154和0.8817,预测集决定系数为0.8913和0.7843。本研究结果可为工业生产过程中产品质量快速检测和工艺条件控制提供理论支撑。 展开更多
关键词 二维相关红外光谱 大豆分离蛋白 二级结构 PH值变化 预测模型 快速分析
在线阅读 下载PDF
羊口疮病毒F1L蛋白二级结构分析与表位预测 被引量:20
8
作者 王光祥 尚佑军 +3 位作者 吕占禄 张克山 田宏 刘湘涛 《中国人兽共患病学报》 CAS CSCD 北大核心 2012年第12期1185-1190,共6页
目的利用软件预测羊口疮病毒(ORFV)F1L蛋白的二级结构和细胞表位。方法利用SOPMA服务器预测ORFV F1L蛋白的二级结构,以DNAStar软件单参数(二级结构、亲水性、可及性、柔韧性及抗原性)预测结果为基础,通过二级结构预测初步筛选,并以ABCp... 目的利用软件预测羊口疮病毒(ORFV)F1L蛋白的二级结构和细胞表位。方法利用SOPMA服务器预测ORFV F1L蛋白的二级结构,以DNAStar软件单参数(二级结构、亲水性、可及性、柔韧性及抗原性)预测结果为基础,通过二级结构预测初步筛选,并以ABCpred方案作为最终验证,预测羊口疮病毒(ORFV)F1L蛋白的B细胞表位;运用神经网络+量化矩阵法(ANNs+QM法)预测ORFV F1L蛋白的CTL细胞表位;使用MHC-II类分子结合肽在线程序预测ORFV F1L蛋白的Th细胞表位。结果 ORFV F1L蛋白含有α-螺旋34.71%、β-片层18.82%、β-转角5.88%、无规则卷曲40.59%;没有信号肽,可能存在7个B细胞表位,2个CTL表位,3个Th细胞表位。结论该研究结果将为建立ORFV诊断方法、制备单克隆抗体及合成肽疫苗提供理论依据。 展开更多
关键词 羊口疮病毒 F1L基因 二级结构 细胞表位 预测
在线阅读 下载PDF
不同折叠类型蛋白编码基因的密码子使用 被引量:9
9
作者 顾万君 马建民 +2 位作者 周童 孙啸 陆祖宏 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第3期362-366,共5页
对 1 95个编码不同折叠类型蛋白 (5 0种全α结构蛋白 ,6 6种全 β结构蛋白 ,3 7种α +β结构蛋白 ,42种α/β结构蛋白 )基因的密码子使用偏性的方差分析研究表明 ,不同折叠类型蛋白的密码子使用偏性有着显著的区别 .特定折叠类型的蛋白... 对 1 95个编码不同折叠类型蛋白 (5 0种全α结构蛋白 ,6 6种全 β结构蛋白 ,3 7种α +β结构蛋白 ,42种α/β结构蛋白 )基因的密码子使用偏性的方差分析研究表明 ,不同折叠类型蛋白的密码子使用偏性有着显著的区别 .特定折叠类型的蛋白有着特定的编码基因的密码子使用模式 .这一结果表明 ,在蛋白质折叠类型和蛋白质二级结构的预测过程中 ,编码基因的密码子使用偏性可以作为蛋白质一级结构以外的一项重要的预测标准 . 展开更多
关键词 编码基因 密码子 蛋白质 折叠类型 二级结构 预测 方差分析 使用偏性 氨基酸
在线阅读 下载PDF
猪内源性反转录病毒囊膜蛋白基因的克隆及其蛋白二级结构和B细胞表位预测 被引量:5
10
作者 吴健敏 孙建华 +6 位作者 吕茂民 陈忠伟 阳玉彪 赵武 陈凤莲 黄红梅 章金刚 《畜牧兽医学报》 CAS CSCD 北大核心 2007年第4期412-416,共5页
猪内源性反转录病毒(PERV)是与猪-人异种移植病原安全性密切相关的一类病毒。env基因编码病毒的囊膜蛋白,它与病毒的亚型分类、宿主感染范围、细胞的嗜性以及对宿主细胞的感染机制、诱导宿主产生中和抗体等密切相关。本研究利用RT-PCR... 猪内源性反转录病毒(PERV)是与猪-人异种移植病原安全性密切相关的一类病毒。env基因编码病毒的囊膜蛋白,它与病毒的亚型分类、宿主感染范围、细胞的嗜性以及对宿主细胞的感染机制、诱导宿主产生中和抗体等密切相关。本研究利用RT-PCR的方法,从五指山小型猪外周血淋巴细胞中扩增PERV的囊膜蛋白基因并进行测序,随后用生物信息学相关软件和方法,对PERV-Env蛋白二级结构及B细胞表位进行预测。经综合分析评价,结果发现PERV-Env蛋白有18个可能的B细胞优势抗原表位区域,7个可能的糖基化位点。该分析预测结果不但有利于PERV疫苗的设计、单抗及诊断试剂研制,而且将有助于分析Env蛋白的功能及PERV对人源细胞的感染机制。 展开更多
关键词 PERV Env蛋白 B细胞表位 二级结构 预测
在线阅读 下载PDF
基于级联神经网络的蛋白质二级结构预测 被引量:7
11
作者 王艳春 何东健 王守志 《计算机工程》 CAS CSCD 北大核心 2010年第4期22-24,共3页
为提高蛋白质二级结构预测的精度,提出一种由两层网络构成的级联神经网络模型。第1层网络采用具有差异度的5个子网构成的网络模型,对第2层网络的输入编码进行改进。对PDBSelect25中的36条蛋白质共6122个残基进行测试,结果表明,该模型能... 为提高蛋白质二级结构预测的精度,提出一种由两层网络构成的级联神经网络模型。第1层网络采用具有差异度的5个子网构成的网络模型,对第2层网络的输入编码进行改进。对PDBSelect25中的36条蛋白质共6122个残基进行测试,结果表明,该模型能有效预测蛋白质二级结构,其预测精度分别比SNN,DSC,PREDSATOR方法提高5.31%,1.21%和0.92%,平均预测精度提高到69.61%。 展开更多
关键词 神经网络 蛋白质 二级结构预测
在线阅读 下载PDF
蓝舌病病毒VP7蛋白的B细胞表位预测 被引量:6
12
作者 杜杰 尹惠琼 +3 位作者 杨姝 马玉媛 韦平 章金刚 《中国动物传染病学报》 CAS 2013年第1期29-36,共8页
根据前期试验中测得的蓝舌病病毒VP7蛋白的基因序列和推导的氨基酸序列,利用DNAStar软件和Biosun软件进行生物信息学预测,以单参数(亲水性、可及性、柔韧性、抗原性)预测为基础,结合二级结构预测来综合分析蓝舌病病毒VP7蛋白的B细... 根据前期试验中测得的蓝舌病病毒VP7蛋白的基因序列和推导的氨基酸序列,利用DNAStar软件和Biosun软件进行生物信息学预测,以单参数(亲水性、可及性、柔韧性、抗原性)预测为基础,结合二级结构预测来综合分析蓝舌病病毒VP7蛋白的B细胞表位。比较两种软件的预测结果发现,在蓝舌病病毒VP7蛋白的381个氨基酸序列中,第81~85、198~202、235~239、253~257区域有较好的亲水性、表面可及性和较高的抗原指数,并且在二级结构上含有易形成抗原袁位的转角和无规则卷曲,最有可能为蓝舌病病毒VP7蛋白的B细胞线性优势表位。上述预测和判定结果表明,在蓝舌病病毒VP7蛋白序列中存在优势B细胞线型表位,为进一步合成多肽并分析已获得的VP7蛋白单抗的结合表位奠定了基础。 展开更多
关键词 蓝舌病毒VP7蛋白 B淋巴细胞表位 二级结构 预测
在线阅读 下载PDF
杨树蛋白质二级结构的人工神经网络预测 被引量:4
13
作者 高光芹 孟庆玲 黄家荣 《西北林学院学报》 CSCD 北大核心 2014年第5期59-63,69,共6页
以PDB公用生物信息数据库为基础,用人工神经网络建模技术对杨树蛋白质二级结构预测模型进行了研究,这对深入认识森林动态机理、提高森林资源信息化管理水平、改进森林保护制药设计等具有重要的应用价值,对森林生物学、森林生物信息学的... 以PDB公用生物信息数据库为基础,用人工神经网络建模技术对杨树蛋白质二级结构预测模型进行了研究,这对深入认识森林动态机理、提高森林资源信息化管理水平、改进森林保护制药设计等具有重要的应用价值,对森林生物学、森林生物信息学的研究具有重要的学术意义。从公用数据库下载杨树蛋白质样本27个,提取氨基酸2 947个。用长度为17的滑动窗口截取蛋白质一级结构的氨基酸序列片段,并用[-1,1]编码方式进行编码,以组织输入向量,以片段中心氨基酸对应的蛋白质二级结构(螺旋、折叠、无规则卷曲)为输出向量,构建了结构为17∶S∶3的BP人工神经网络模型。用训练、测试样本对模型进行训练、检验,得出理想的模型结构为17∶9∶3,其总体拟合准确度为71%,总体预测准确度为65%,H的预测准确度达81%,比以往同类研究具有较高的预测准确度。 展开更多
关键词 杨树 蛋白质 二级结构 人工神经网络 预测
在线阅读 下载PDF
编码方式对蛋白质二级结构预测精度的影响 被引量:12
14
作者 阮晓钢 孙海军 《北京工业大学学报》 CAS CSCD 北大核心 2005年第3期229-235,共7页
为了比较在蛋白质二级结构预测中常用的氨基酸序列编码方式的优缺点,借助前向型BP神经网络对正交编码、5位编码、Codon(2种)编码和Profile编码5种氨基酸编码方式进行了对比分析.实验结果显示,用富含"生物进化信息"的Profile... 为了比较在蛋白质二级结构预测中常用的氨基酸序列编码方式的优缺点,借助前向型BP神经网络对正交编码、5位编码、Codon(2种)编码和Profile编码5种氨基酸编码方式进行了对比分析.实验结果显示,用富含"生物进化信息"的Profile编码方式可以得到较高的预测结果,同时也表明,充分利用生物本身所具有的生物信息对提高蛋白质二级结构预测精度是非常重要的. 展开更多
关键词 氨基酸序列编码 蛋白质二级结构 神经网络
在线阅读 下载PDF
蛋白质结构型的定义和识别 被引量:5
15
作者 李晓琴 罗辽复 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2002年第1期124-127,共4页
提出紧结构域的概念 ,由二级结构序列中一段或几段连续的α螺旋和 β折叠构成的空间紧密堆集的最大折叠体称为紧结构域 .利用 3种紧结构域 (α域 ,β域和α/β域 )定义球蛋白的 5种结构型 :α型蛋白 ,β型蛋白 ,α/β型蛋白 ,多域蛋白和... 提出紧结构域的概念 ,由二级结构序列中一段或几段连续的α螺旋和 β折叠构成的空间紧密堆集的最大折叠体称为紧结构域 .利用 3种紧结构域 (α域 ,β域和α/β域 )定义球蛋白的 5种结构型 :α型蛋白 ,β型蛋白 ,α/β型蛋白 ,多域蛋白和 ζ型蛋白 .将 12 6 1个代表性的蛋白质 (10 2 2家族 )进行分类 ,并和SCOP库的分类做了比较 .进行了删去序列冗余的分析 .在此基础上提出结构型的预测方案 ,成功率在 82 %~ 85 %. 展开更多
关键词 蛋白质结构型 二级结构序列 紧结构域 序列冗余 预测 识别
在线阅读 下载PDF
基于深度学习的八类蛋白质二级结构预测算法 被引量:5
16
作者 张蕾 李征 +1 位作者 郑逢斌 杨伟 《计算机应用》 CSCD 北大核心 2017年第5期1512-1515,共4页
蛋白质二级结构预测是结构生物学中的一个重要问题。针对八类蛋白质二级结构预测,提出了一种基于递归神经网络和前馈神经网络的深度学习预测算法。该算法通过双向递归神经网络建模氨基酸间的局部和长程相互作用,递归神经网络的隐层输出... 蛋白质二级结构预测是结构生物学中的一个重要问题。针对八类蛋白质二级结构预测,提出了一种基于递归神经网络和前馈神经网络的深度学习预测算法。该算法通过双向递归神经网络建模氨基酸间的局部和长程相互作用,递归神经网络的隐层输出进一步送入到三层的前馈神经网络以便进行八类蛋白质二级结构预测。实验结果表明,提出的算法在CB513数据集上达到了67.9%的Q_8预测精度,显著地优于SSpro8和SC-GSN。 展开更多
关键词 深度学习 递归神经网络 前馈神经网络 蛋白质二级结构预测
在线阅读 下载PDF
不同折叠类型蛋白中基于密码子的二级结构偏向性分析 被引量:1
17
作者 顾万君 周童 +2 位作者 马建民 孙啸 陆祖宏 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第1期72-77,共6页
在传统的Chou Fasman蛋白质二级结构预测方法的基础上引入同义密码子使用的信息 ,计算了 2 0 0个蛋白 ( 4 9种全α结构蛋白 ,69种全β结构蛋白 ,38种α + β结构蛋白 ,44种α/β结构蛋白 )中不同密码子对应的氨基酸形成不同二级结构 (... 在传统的Chou Fasman蛋白质二级结构预测方法的基础上引入同义密码子使用的信息 ,计算了 2 0 0个蛋白 ( 4 9种全α结构蛋白 ,69种全β结构蛋白 ,38种α + β结构蛋白 ,44种α/β结构蛋白 )中不同密码子对应的氨基酸形成不同二级结构 (α :螺旋 ,β :折叠 ,C :卷曲 )的偏向性参数 .通过对这些密码子对应氨基酸二级结构偏向性的分析 ,得到了氨基酸二级结构偏向性分析中所忽略的同义密码子的蛋白结构信息 . 展开更多
关键词 同义密码子使用 氨基酸二级结构偏向性 蛋白质二级结构预测 蛋白质折叠类型 蛋白设计
在线阅读 下载PDF
基于遗传算法的蛋白质二级结构预测方法研究进展 被引量:2
18
作者 孟翔燕 孟军 葛家麒 《农机化研究》 北大核心 2009年第5期72-75,79,共5页
蛋白质二级结构预测方法的研究目前已成为生物信息学研究的重要课题之一。为此,从从头预测、比较建模和混合方法3个方面阐述了近几年遗传算法在蛋白质二级结构预测中的应用研究进展,并分析了算法的效果和特点,最后展望了遗传算法在蛋白... 蛋白质二级结构预测方法的研究目前已成为生物信息学研究的重要课题之一。为此,从从头预测、比较建模和混合方法3个方面阐述了近几年遗传算法在蛋白质二级结构预测中的应用研究进展,并分析了算法的效果和特点,最后展望了遗传算法在蛋白质二级结构预测中应用的前景与方向。 展开更多
关键词 遗传算法 蛋白质二级结构预测 从头预测 比较建模
在线阅读 下载PDF
GP-MaxEnt模型的蛋白质二级结构预测 被引量:1
19
作者 杨伟 王宽全 左旺孟 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2009年第8期65-68,共4页
针对单序列蛋白质二级结构预测问题,提出了一种基于高斯先验最大熵(GP-MaxEnt)模型的预测方法.该方法根据氨基酸的构象偏好进行特征构造,利用改进迭代缩放算法(ⅡS)训练高斯先验最大熵模型.使用CB513数据集对GP-MaxEnt模型进行了测试分... 针对单序列蛋白质二级结构预测问题,提出了一种基于高斯先验最大熵(GP-MaxEnt)模型的预测方法.该方法根据氨基酸的构象偏好进行特征构造,利用改进迭代缩放算法(ⅡS)训练高斯先验最大熵模型.使用CB513数据集对GP-MaxEnt模型进行了测试分析.试验表明,该方法简单有效,能够获得较好的预测精度. 展开更多
关键词 蛋白质二级结构预测 单序列预测 最大熵模型 高斯先验
在线阅读 下载PDF
应用优化的隐马尔可夫模型预测蛋白质二级结构 被引量:1
20
作者 石鸥燕 杨惠云 +1 位作者 杨晶 田心 《高技术通讯》 EI CAS CSCD 北大核心 2008年第7期738-742,共5页
针对3-状态隐马尔可夫模型(HMM)预测蛋白质二级结构准确率不高的问题,提出了7-状态和15-状态 HMM。研究对象为 CB513数据集合中筛选出的492条蛋白质序列,将其随机均分7组。分别应用7-状态和15-状态 HMM 对以上数据集进行二级结构预测,... 针对3-状态隐马尔可夫模型(HMM)预测蛋白质二级结构准确率不高的问题,提出了7-状态和15-状态 HMM。研究对象为 CB513数据集合中筛选出的492条蛋白质序列,将其随机均分7组。分别应用7-状态和15-状态 HMM 对以上数据集进行二级结构预测,对预测准确率进行了7-交叉验证,并将预测结果与应用3-状态 HMM 的预测结果进行了比较。结果表明,应用7-状态 HMM,Q_3准确率提高3.11%,SOV 提高6.15%,Q_E提高6.49%;应用15-状态 HMM,Q_E比7-状态 HMM 又提高5.74%。在15.状态 HMM 预测中加入序列的同源信息后,Q_3准确率比单序列15-状态 HMM 增加8.76%。结果表明,7-状态HMM 预测能力优于3-状态 HMM,15-状态 HMM 总体预测能力和7-状态 HMM 相当,但β折叠预测能力强于7-状态 HMM。 展开更多
关键词 蛋白质二级结构预测 隐马尔可夫模型(HMM) 7-状态 15-状态
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部