期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种基于蛋白质交互网络链接预测的新方法 被引量:3
1
作者 李晶 尚学群 +1 位作者 郭阳 李晓园 《计算机应用研究》 CSCD 北大核心 2012年第11期4060-4063,4078,共5页
当前可用的生物数据在不断地迅速增长,仍有很多生物信息如蛋白质交互信息(protein-protein interac-tion,PPI)还未被发现,而这些潜在的或未知的信息对生物过程的研究是至关重要的。近年来,对未知生物信息的挖掘和研究吸引了很多人的关... 当前可用的生物数据在不断地迅速增长,仍有很多生物信息如蛋白质交互信息(protein-protein interac-tion,PPI)还未被发现,而这些潜在的或未知的信息对生物过程的研究是至关重要的。近年来,对未知生物信息的挖掘和研究吸引了很多人的关注。通过实验检测方法来发现这些信息是非常耗时耗力的,所以链接预测成为一种新的挖掘这些信息的指导方法。基于蛋白质交互网络并融合了基因表达数据信息,从拓扑和基因表达两个方面的信息来构建PPI权值网络,提出了一种在权值网络中基于相似度比较的链接预测的新方法来预测PPI网络中未知的交互信息。使用MIPS数据库评估了实验结果,表明了该算法有很好的准确率和良好的性能。 展开更多
关键词 蛋白质交互网络 链接预测 权值网络 相关节点集 剪枝
在线阅读 下载PDF
一个面向OLAP的多维层次聚簇存储模式 被引量:1
2
作者 袁霖 邹恒明 李战怀 《计算机科学》 CSCD 北大核心 2007年第9期110-113,124,共5页
文献[2]针对ROLAP提出的多维层次聚簇存储模式(MHC),极大地提高了查询效率。然而与ROLAP相比,MOLAP往往具有更高的存储效率和查询效率。这让人自然地联想到:如果能构造一个集二者优点为一身的混合型OLAP系统,以实现MHC,也许能进一步提... 文献[2]针对ROLAP提出的多维层次聚簇存储模式(MHC),极大地提高了查询效率。然而与ROLAP相比,MOLAP往往具有更高的存储效率和查询效率。这让人自然地联想到:如果能构造一个集二者优点为一身的混合型OLAP系统,以实现MHC,也许能进一步提高系统性能。作为这一设想的探索性研究,本文利用ORDBMS的可扩展性实现了这一原形系统:多维数据按维层次分块聚簇,其中每个分块以数组ADT存储,分块间以B^+树索引聚簇。实验表明,本文提出的MHC实现能有效减少存储空间,进一步提高查询性能。 展开更多
关键词 联机分析处理 层次 聚簇 对象关系数据库
在线阅读 下载PDF
从基因表达数据中挖掘最大的行常量双聚类 被引量:5
3
作者 缪苗 尚学群 +1 位作者 刘加财 王淼 《计算机应用研究》 CSCD 北大核心 2011年第12期4447-4450,共4页
双聚类方法是当前分析基因表达数据的一个重要研究方向,其挖掘目标是发现哪些基因在哪些实验条件下具有相似的表达水平或者关系密切。目前已提出了许多双聚类算法来挖掘不同类型的双聚类,然而其大部分挖掘效率不高。鉴于此,提出了一个... 双聚类方法是当前分析基因表达数据的一个重要研究方向,其挖掘目标是发现哪些基因在哪些实验条件下具有相似的表达水平或者关系密切。目前已提出了许多双聚类算法来挖掘不同类型的双聚类,然而其大部分挖掘效率不高。鉴于此,提出了一个新颖的挖掘算法———MRCluster,其主要是用来从原始的基因表达数据中挖掘最大的行常量双聚类模式。就其挖掘效率来说,它采用的是基于Apriori原则的基因扩展深度优先的挖掘策略,并且在挖掘过程中引入了一些新颖的剪枝技术来提高效率。将MRCluster和一个行常量双聚类模式挖掘方法 RAP(range support pattern)算法进行比较,从实验结果上可以看出,相比RAP算法,MRCluster算法对在原始的基因表达数据中挖掘最大的行常量双聚类模式具有更好的效率。因此,MRCluster算法能够有效地从原始的基因表达数据中挖掘最大的行常量双聚类。 展开更多
关键词 双聚类 原始数据 行常量双聚类 范围支持度 基因芯片
在线阅读 下载PDF
基于不确定性PPI网络的最大稠密子图挖掘 被引量:1
4
作者 刘加财 尚学群 +1 位作者 孟雅 王淼 《计算机应用研究》 CSCD 北大核心 2011年第11期4134-4137,4141,共5页
研究表明使用PPI数据进行蛋白质功能预测是很有意义的。然而,从生物学实验得到的PPI数据一般是含有噪声的、不完全的和不精确的,这使得将PPI网络作为不确定图来处理变得更加合理。提出了一种基于深度优先搜索策略和点扩展的挖掘算法,它... 研究表明使用PPI数据进行蛋白质功能预测是很有意义的。然而,从生物学实验得到的PPI数据一般是含有噪声的、不完全的和不精确的,这使得将PPI网络作为不确定图来处理变得更加合理。提出了一种基于深度优先搜索策略和点扩展的挖掘算法,它可以有效地从不确定的PPI网络中挖掘最大稠密子图。该算法使用了几种高效的剪枝技术来提高挖掘的时间效率。在酵母菌PPI数据上的实验结果表明该算法在精度和效率上都有很好的表现。 展开更多
关键词 PPI网络 不确定图 稠密子图 期望支持度
在线阅读 下载PDF
基于离散时序基因表达数据的双聚类算法 被引量:1
5
作者 许涛 尚学群 +1 位作者 杨蜜静 王淼 《计算机应用研究》 CSCD 北大核心 2013年第12期3551-3556,3567,共7页
目前应用于基因表达数据上的双聚类算法大多是基于真实数据提出的,因此易受噪声干扰,且这些算法很少考虑样本间的时序性。提出了一种有效的时间点连续的双聚类挖掘算法DTCB,从离散的时序基因表达数据中挖掘出时间点连续的最大共表达双... 目前应用于基因表达数据上的双聚类算法大多是基于真实数据提出的,因此易受噪声干扰,且这些算法很少考虑样本间的时序性。提出了一种有效的时间点连续的双聚类挖掘算法DTCB,从离散的时序基因表达数据中挖掘出时间点连续的最大共表达双聚类。该算法使用了一种新的数据离散化方法,同时提出了三种在离散数据集下基因间的共表达关系;为了提高挖掘效率,DTCB使用了有效的剪枝和输出策略,可以在不产生候选集的情况下一次性挖掘出所有的最大共表达双聚类。通过实验分析,证明DTCB具有高效的性能和良好的鲁棒性,且结果具有较好的统计和生物意义。 展开更多
关键词 时序基因表达数据 双聚类 共表达 时间点连续 离散化
在线阅读 下载PDF
从基因表达数据中有效挖掘差异共表达双聚类——DiCluster算法 被引量:1
6
作者 李晓园 尚学群 王淼 《计算机应用研究》 CSCD 北大核心 2012年第11期4087-4092,共6页
双聚类是一种可以同时在基因和条件两个维度上分析基因表达数据的方法,它可以找出在部分条件下具有相似表达趋势的基因。已有的方法都是从一个数据集中挖掘双聚类。从生物意义上分析,从不同基因表达数据集中挖掘差异表达双聚类可以发现... 双聚类是一种可以同时在基因和条件两个维度上分析基因表达数据的方法,它可以找出在部分条件下具有相似表达趋势的基因。已有的方法都是从一个数据集中挖掘双聚类。从生物意义上分析,从不同基因表达数据集中挖掘差异表达双聚类可以发现具有生物意义的转录因子等信息。因此,提出一种挖掘不同数据集上差异共表达双聚类的算法——DiCluster。该算法采用深度优先基因扩展方法,并引入了剪枝策略,有效挖掘最大差异表达双聚类。实验结果表明,DiCluster不仅比已有算法具有更高的效率,而且挖掘出的结果具有更好的统计学和生物学意义。 展开更多
关键词 基因表达数据 双聚类 差异共表达
在线阅读 下载PDF
基于不确定PPI网络的功能模块挖掘
7
作者 孟雅 尚学群 +1 位作者 缪苗 王淼 《计算机应用研究》 CSCD 北大核心 2011年第12期4481-4484,4491,共5页
近年来,挖掘具有生物学意义的功能模块,吸引了很多人的关注。但是,生物信息学中的蛋白质交互(PPI)网络和其他的一些生物数据常常会由于实验检测方法的局限性而呈现出不确定性。以具有不确定性的PPI数据为研究对象,挖掘蛋白质复合物。引... 近年来,挖掘具有生物学意义的功能模块,吸引了很多人的关注。但是,生物信息学中的蛋白质交互(PPI)网络和其他的一些生物数据常常会由于实验检测方法的局限性而呈现出不确定性。以具有不确定性的PPI数据为研究对象,挖掘蛋白质复合物。引入了一些新概念,并给出了一个深度优先算法。使用MIPS数据库评估实验结果表明,该算法在精确度和覆盖率两个方面性能优良。在基因拓扑上分析实验结果证实了所得到的大多数蛋白质复合物具有很高的相似性。最后也对算法的可扩展性进行了验证。总之,可以有效地从不确定PPI网络中挖掘出功能模块。 展开更多
关键词 功能模块 蛋白质交互 不确定图 期望稠密度 相关度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部