期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
词袋模型在蛋白质亚细胞定位预测中的应用 被引量:5
1
作者 赵南 张梁 +2 位作者 薛卫 王雄飞 任守纲 《食品与生物技术学报》 CAS CSCD 北大核心 2017年第3期296-301,共6页
运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预... 运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预测的准确率。 展开更多
关键词 词袋模型 K-MEANS 支持向量机 亚细胞定位预测
在线阅读 下载PDF
蛋白质亚细胞定位预测研究综述 被引量:6
2
作者 乔善平 闫宝强 《计算机应用研究》 CSCD 北大核心 2014年第2期321-327,共7页
蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越... 蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越重要。为了能够把握该问题的研究状况,从数据集构建、蛋白质特征提取与表示、预测算法设计、算法测试和Web服务的建立等五个方面对蛋白质亚细胞定位预测的研究进行了综述。指出了目前该研究领域需要解决的核心问题及难点问题,分析了当前研究中出现的一些新情况,并对将来的研究方向和研究重点进行了展望。 展开更多
关键词 蛋白质亚细胞定位预测 特征表示 算法设计 算法测试 WEB服务器
在线阅读 下载PDF
基于GM(2,1)的亚细胞定位预测 被引量:4
3
作者 林卫中 肖绚 《计算机工程》 CAS CSCD 北大核心 2009年第8期225-226,229,共3页
对于蛋白质氨基酸序列,使用GM(2,1)模型的参数作为伪氨基酸成分,加上各氨基酸在序列中所占比例,构成蛋白质的灰色伪氨基酸成分表示。利用扩大协方差算法预测亚细胞定位,开发基于该方法的亚细胞定位预测服务器。在相同的数据集上,对比实... 对于蛋白质氨基酸序列,使用GM(2,1)模型的参数作为伪氨基酸成分,加上各氨基酸在序列中所占比例,构成蛋白质的灰色伪氨基酸成分表示。利用扩大协方差算法预测亚细胞定位,开发基于该方法的亚细胞定位预测服务器。在相同的数据集上,对比实验结果显示,该预测服务器在总体预测率上达到77.6%,比其他预测方法优越。相关的研究拓展了灰色理论在生物信息学上的应用。 展开更多
关键词 细胞定位 灰色模型GM(2 1) 灰色伪氨基酸成分 亚细胞定位预测服务器
在线阅读 下载PDF
基于三层集成多标记学习的蛋白质多亚细胞定位预测 被引量:1
4
作者 乔善平 闫宝强 《计算机应用》 CSCD 北大核心 2016年第8期2150-2156,共7页
针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框... 针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框架将学习算法和分类器进行了层次性分类,并把二分类学习、多分类学习、多标记学习和集成学习进行有效整合,形成一个通用型的三层集成多标记学习模型;其次,基于面向对象技术和统一建模语言(UML)对系统模型进行了设计,使系统具备良好的可扩展性,通过扩展手段增强系统的功能和提高系统的性能;最后,使用Java编程技术对模型进行扩展,实现了一个学习系统软件,并成功应用于蛋白质多亚细胞定位预测问题上。通过在革兰氏阳性细菌数据集上进行测试,验证了系统功能的可操作性和较好的预测性能,该系统可以作为解决蛋白质多亚细胞定位预测问题的一个有效工具。 展开更多
关键词 蛋白质多亚细胞定位预测 多标记学习 集成学习 面向对象技术 JAVA
在线阅读 下载PDF
蛋白质亚细胞定位预测中的序列编码技术研究 被引量:1
5
作者 马军伟 高新中 张杰 《计算机科学》 CSCD 北大核心 2012年第S3期283-287,312,共6页
随着后基因组时代的来临,蛋白质序列数量增长迅速,利用实验手段分析蛋白质亚细胞定位不易大规模进行。近年来,通过提取蛋白质的各种特征信息(序列编码技术),自动预测蛋白质的亚细胞定位的算法得到了较快的发展。综述了当前已有的序列编... 随着后基因组时代的来临,蛋白质序列数量增长迅速,利用实验手段分析蛋白质亚细胞定位不易大规模进行。近年来,通过提取蛋白质的各种特征信息(序列编码技术),自动预测蛋白质的亚细胞定位的算法得到了较快的发展。综述了当前已有的序列编码技术成果,并指出了存在的问题及可能的发展方向。 展开更多
关键词 蛋白质亚细胞定位预测 序列编码技术 氨基酸组成成分 功能域组成 基因本体
在线阅读 下载PDF
PSO_BFA优化词袋模型及蛋白质亚细胞定位预测 被引量:2
6
作者 胡雪娇 陈行健 +1 位作者 赵南 薛卫 《计算机工程与应用》 CSCD 北大核心 2020年第1期165-171,共7页
提出了一种基于PSO_BFA优化的词袋模型。传统词袋模型有两个重要参数:窗口大小d和字典大小k。结合粒子群算法和细菌觅食算法产生新的PSO_BFA混合优化算法,在PSO进行局部搜索时,加入BFA的复制和迁移行为,得到PSO_BFA的最优解即为窗口大... 提出了一种基于PSO_BFA优化的词袋模型。传统词袋模型有两个重要参数:窗口大小d和字典大小k。结合粒子群算法和细菌觅食算法产生新的PSO_BFA混合优化算法,在PSO进行局部搜索时,加入BFA的复制和迁移行为,得到PSO_BFA的最优解即为窗口大小和字典大小的最佳组合。将优化词袋模型与蛋白质序列的氨基酸组成算法和伪氨基酸组成算法结合,获得蛋白质序列的词袋特征。实验结果证明,基于PSO_BFA优化的词袋模型能有效提高蛋白质亚细胞定位预测的精度。 展开更多
关键词 词袋模型 粒子群算法 细菌觅食 亚细胞定位预测
在线阅读 下载PDF
葡萄基因组无内含子基因生物信息学及其表达分析 被引量:3
7
作者 李傲 崔梦杰 +4 位作者 刘众杰 陈立德 贾海峰 上官凌飞 房经贵 《南京农业大学学报》 CAS CSCD 北大核心 2018年第4期655-661,共7页
[目的]本文旨在研究葡萄(Vitis vinifera)无内含子基因的结构特征、功能以及表达特点。[方法]对葡萄19条染色体上4 906个(占整个基因组的13.8%)无内含子基因情况进行分析,并研究了无内含子基因的亚细胞结构、GO功能类型以及基因在不同... [目的]本文旨在研究葡萄(Vitis vinifera)无内含子基因的结构特征、功能以及表达特点。[方法]对葡萄19条染色体上4 906个(占整个基因组的13.8%)无内含子基因情况进行分析,并研究了无内含子基因的亚细胞结构、GO功能类型以及基因在不同组织的表达情况。[结果]葡萄无内含子基因数与每条染色体长度和染色体的基因总数存在正相关关系,每条染色体上无内含子基因占染色体上基因总数的1.2%~1.5%,同时无内含子基因在同一条染色体上的分布是不均匀的,更偏向富集于染色体的两端。葡萄无内含子基因的平均长度为997 bp,比总基因的平均长度短,是总基因长度的1/5。葡萄无内含子基因的亚细胞定位表明,基因产物分布在叶绿体上的数最多,线粒体上几乎没有。基因功能预测结果表明,葡萄无内含子基因主要为生长因子、转录调控、电压门控离子通道以及结构蛋白4种,其中更多参与生长调节。葡萄无内含子基因在不同组织中的表达水平低于有内含子的基因。[结论]葡萄无内含子基因与有内含子基因相比长度较短,表达水平较低。 展开更多
关键词 葡萄 无内含子基因 生物信息学 亚细胞定位预测 功能预测 基因表达
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部