期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
PipelineJoin:一种新的基于MapReduce的多表连接算法 被引量:3
1
作者 林子雨 李雨倩 +1 位作者 李粲 赖永炫 《中国科学技术大学学报》 CAS CSCD 北大核心 2015年第10期836-845,共10页
MapReduce是一个并行分布式计算模型,已经被广泛应用于处理两个或多个大型表的连接操作.现有的基于MapReduce的多表连接算法,在处理链式连接时,不能处理多个大表的连接,或者需要顺序运行较多的MapReduce任务,效率较低.为此提出了一种基... MapReduce是一个并行分布式计算模型,已经被广泛应用于处理两个或多个大型表的连接操作.现有的基于MapReduce的多表连接算法,在处理链式连接时,不能处理多个大表的连接,或者需要顺序运行较多的MapReduce任务,效率较低.为此提出了一种基于MapReduce的多表连接算法——PipelineJoin,高效地实现任意多个大表的链式连接.PipelineJoin采用流水线模型和调度器来实现MapReduce任务的流水线式执行,从而有效提高多表连接的效率,同时可以较好地克服链式多表连接算法的缺陷.最后,在不同规模的数据集上进行了大量实验,实验结果表明PipelineJoin算法与原有链式多表连接算法相比,可以有效减少连接所需的时间. 展开更多
关键词 连接 多表 MAPREDUCE pipelinejoin
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部