期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于HDFS开源架构与多级索引表的海量数据检索mDHT算法 被引量:4
1
作者 汤羽 王英杰 +1 位作者 范爱华 姚远哲 《计算机科学》 CSCD 北大核心 2013年第2期195-199,234,共6页
针对大规模能源数据系统的存储与快速检索需求,提出了一种基于HDFS/Hadoop开源平台的云存储架构及多级索引目录体系,以及此架构下的基于多级索引表的mDHT算法,并完成了算法的MapReduce编程实现。基于上述算法完成的4800万条数据的仿真... 针对大规模能源数据系统的存储与快速检索需求,提出了一种基于HDFS/Hadoop开源平台的云存储架构及多级索引目录体系,以及此架构下的基于多级索引表的mDHT算法,并完成了算法的MapReduce编程实现。基于上述算法完成的4800万条数据的仿真实验表明:在数据量达到1200万~4800万条时,采用多级索引表的mDHT算法较常规的MS SQL Server实现和HDFS/Hive方法在检索性能方面有质的飞跃;与单级索引表检索方法比较,在数据查找时间上也有24.5%~57.8%的显著降低。文中提出的基于多级索引表的DHT算法为构建基于云存储架构的海量数据快速搜索引擎提供了一个关键技术。 展开更多
关键词 大规模数据处理 云存储 多级索引表 查找算法 MAPREDUCE
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部