期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
蛋白质亚细胞定位预测研究综述 被引量:6
1
作者 乔善平 闫宝强 《计算机应用研究》 CSCD 北大核心 2014年第2期321-327,共7页
蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越... 蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越重要。为了能够把握该问题的研究状况,从数据集构建、蛋白质特征提取与表示、预测算法设计、算法测试和Web服务的建立等五个方面对蛋白质亚细胞定位预测的研究进行了综述。指出了目前该研究领域需要解决的核心问题及难点问题,分析了当前研究中出现的一些新情况,并对将来的研究方向和研究重点进行了展望。 展开更多
关键词 蛋白质亚细胞定位预测 特征表示 算法设计 算法测试 WEB服务器
在线阅读 下载PDF
一种新的蛋白质亚细胞定位预测训练集构造方法 被引量:2
2
作者 曹隽喆 顾宏 贺建军 《大连理工大学学报》 EI CAS CSCD 北大核心 2012年第6期884-889,共6页
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预... 设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统. 展开更多
关键词 生物信息学 机器学习 蛋白质亚细胞定位 非实验标记数据 主动学习
在线阅读 下载PDF
基于Convolutional-LSTM的蛋白质亚细胞定位研究 被引量:2
3
作者 王春宇 徐珊珊 +2 位作者 郭茂祖 车凯 刘晓燕 《计算机科学与探索》 CSCD 北大核心 2019年第6期982-989,共8页
蛋白质亚细胞位置预测研究是目前蛋白质组学和生物信息学研究的重点问题之一。蛋白质的亚细胞定位决定了它的生物学功能,故研究亚细胞定位对了解蛋白质功能非常重要。由于蛋白质结构的序列性,考虑使用序列模型来进行亚细胞定位研究。尝... 蛋白质亚细胞位置预测研究是目前蛋白质组学和生物信息学研究的重点问题之一。蛋白质的亚细胞定位决定了它的生物学功能,故研究亚细胞定位对了解蛋白质功能非常重要。由于蛋白质结构的序列性,考虑使用序列模型来进行亚细胞定位研究。尝试使用卷积神经网络(convolutional neural network,CNN)、长短期记忆神经网络(long short-term memory,LSTM)两种模型挖掘氨基酸序列所包含的信息,从而进行亚细胞定位的预测。随后构建了基于卷积的长短期记忆网络(Convolutional-LSTM)的集成模型进行亚细胞定位。首先通过卷积神经网络对蛋白质数据进行特征抽取,随后进行特征组合,并将其送入长短期记忆神经网络进行特征表征学习,得到亚细胞定位结果。使用该模型能达到0.816 5的分类准确率,比传统方法有明显提升。 展开更多
关键词 蛋白质亚细胞定位 卷积神经网络(CNN) 长短期记忆神经网络(LSTM) 分类
在线阅读 下载PDF
一种新的蛋白质亚细胞定位预测方法 被引量:1
4
作者 程昔恩 吴志诚 《计算机工程与应用》 CSCD 2012年第6期126-128,共3页
蛋白质亚细胞定位是蛋白质组学基本问题之一。某些类型蛋白质可能存在于两个或两个以上的亚细胞位置,这类蛋白质的亚细胞定位问题更为复杂。分别利用Gene Ontology和伪氨基酸成分法,将一条蛋白质表示为一实值向量;采纳多标记学习中的Ran... 蛋白质亚细胞定位是蛋白质组学基本问题之一。某些类型蛋白质可能存在于两个或两个以上的亚细胞位置,这类蛋白质的亚细胞定位问题更为复杂。分别利用Gene Ontology和伪氨基酸成分法,将一条蛋白质表示为一实值向量;采纳多标记学习中的Ranking思想,计算出一得分向量V,该向量的每一分量的值表示被预测蛋白质属于某个亚细胞位置的概率;利用最近邻算法预测蛋白质所属亚细胞位置的个数n,得分向量V中得分最高的n个分量对应的亚细胞位置即为预测的位置。 展开更多
关键词 蛋白质亚细胞定位 多标记学习 GENE ONTOLOGY 最近邻算法
在线阅读 下载PDF
蛋白质亚细胞定位预测的最近邻算法 被引量:1
5
作者 宋杰 《计算机应用研究》 CSCD 北大核心 2007年第11期30-31,36,共3页
基于蛋白质的氨基酸组成,采用三种几何距离,即Euclidean距离、Minkowski距离和广义距离,利用最近邻算法对蛋白质亚细胞定位进行预测。结果表明该方法新颖、简单、有效。
关键词 生物信息学 蛋白质亚细胞定位 氨基酸组成 最近邻算法
在线阅读 下载PDF
PCA方法在蛋白质亚细胞定位中应用 被引量:1
6
作者 马军伟 史舵 +1 位作者 顾宏 张杰 《大连理工大学学报》 EI CAS CSCD 北大核心 2012年第3期426-430,共5页
蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建而成,应用一种数据分析方法——主成分分析(PCA)法,确定能反映... 蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建而成,应用一种数据分析方法——主成分分析(PCA)法,确定能反映序列次序效应的最优λ值.首先让λ取最大以包含尽可能多的序列次序信息,然后利用主成分分析法提取关键主特征.实验结果表明此方法能解决确定最优λ值困难的问题,且性能优于已有的预测工具. 展开更多
关键词 蛋白质亚细胞定位 主成分分析 伪氨基酸组成 K近邻分类器 BP神经网络
在线阅读 下载PDF
蛋白质亚细胞定位预测中的序列编码技术研究 被引量:1
7
作者 马军伟 高新中 张杰 《计算机科学》 CSCD 北大核心 2012年第S3期283-287,312,共6页
随着后基因组时代的来临,蛋白质序列数量增长迅速,利用实验手段分析蛋白质亚细胞定位不易大规模进行。近年来,通过提取蛋白质的各种特征信息(序列编码技术),自动预测蛋白质的亚细胞定位的算法得到了较快的发展。综述了当前已有的序列编... 随着后基因组时代的来临,蛋白质序列数量增长迅速,利用实验手段分析蛋白质亚细胞定位不易大规模进行。近年来,通过提取蛋白质的各种特征信息(序列编码技术),自动预测蛋白质的亚细胞定位的算法得到了较快的发展。综述了当前已有的序列编码技术成果,并指出了存在的问题及可能的发展方向。 展开更多
关键词 蛋白质亚细胞定位预测 序列编码技术 氨基酸组成成分 功能域组成 基因本体
在线阅读 下载PDF
基于三层集成多标记学习的蛋白质多亚细胞定位预测 被引量:1
8
作者 乔善平 闫宝强 《计算机应用》 CSCD 北大核心 2016年第8期2150-2156,共7页
针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框... 针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框架将学习算法和分类器进行了层次性分类,并把二分类学习、多分类学习、多标记学习和集成学习进行有效整合,形成一个通用型的三层集成多标记学习模型;其次,基于面向对象技术和统一建模语言(UML)对系统模型进行了设计,使系统具备良好的可扩展性,通过扩展手段增强系统的功能和提高系统的性能;最后,使用Java编程技术对模型进行扩展,实现了一个学习系统软件,并成功应用于蛋白质多亚细胞定位预测问题上。通过在革兰氏阳性细菌数据集上进行测试,验证了系统功能的可操作性和较好的预测性能,该系统可以作为解决蛋白质多亚细胞定位预测问题的一个有效工具。 展开更多
关键词 蛋白质细胞定位预测 多标记学习 集成学习 面向对象技术 JAVA
在线阅读 下载PDF
《大连理工大学学报》第52卷(2012年)目次
9
《大连理工大学学报》 EI CAS CSCD 北大核心 2012年第6期I0001-I0014,共14页
关键词 蛋白质亚细胞定位 JUN 工程力学 应用力学 无人驾驶车 水电联产 PING 时延估计方法 目次
在线阅读 下载PDF
基于关系拓展的改进词袋模型研究 被引量:8
10
作者 陈行健 胡雪娇 薛卫 《小型微型计算机系统》 CSCD 北大核心 2019年第5期1040-1044,共5页
提出了一种基于位置关系拓展的改进词袋模型.该模型在传统词袋模型的基础上,结合马尔科夫假设对聚类单词提取位置关系图谱,并对关系图谱进行特征转换,将得到的图谱特征与基于传统词袋模型得到的词袋特征融合作为模型最终特征表示,解决... 提出了一种基于位置关系拓展的改进词袋模型.该模型在传统词袋模型的基础上,结合马尔科夫假设对聚类单词提取位置关系图谱,并对关系图谱进行特征转换,将得到的图谱特征与基于传统词袋模型得到的词袋特征融合作为模型最终特征表示,解决了传统词袋模型中忽略特征单词之间的空间位置信息进而导致特征区分度不足的问题.模型采用词嵌入方法对稀疏图谱进行密集表示,并结合卷积神经网络构建特征学习框架,相比于池化等算法,能更加全面地反映图谱特征的分布规律.将改进词袋模型应用于蛋白质亚细胞区间定位预测研究中,实验表明,文中算法分类结果更优. 展开更多
关键词 词袋模型 关系图谱 马尔科夫 卷积神经网络 蛋白质细胞区间定位
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部