-
题名基于改进DPhyp算法的Impala查询优化
被引量:3
- 1
-
-
作者
周强
陈岭
马骄阳
赵宇亮
吴勇
王敬昌
-
机构
浙江大学计算机科学与技术学院
浙江鸿程计算机系统有限公司
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S2期114-120,共7页
-
基金
"核高基"国家重大科技专项基金项目(2010ZX01042-002-003)
国家自然科学基金项目(60703040)
+1 种基金
浙江省重大科技专项基金项目(2011C13042
2013C01046)
-
文摘
针对目前基于动态规划查询超图(dynamic programming hypergraphs,DPhyp)优化SQL查询算法产生指数运行时间、传统代价模型难以直接适用于Impala大数据实时查询系统等问题,提出基于改进DPhyp算法的Impala查询优化方法.首先,构建满足左线性树的搜索策略,缩小整个执行计划的搜索空间;接着,综合考虑数据移动代价及Hash join算法运行等关键因素,结合提出的代价模型,生成最佳的join顺序;最后,在生成的join顺序基础上构建执行计划,执行后返回最终查询结果.大量实验结果表明,改进的DPhyp算法与DPhyp生成的join顺序一致,且前者算法运行效率比后者要快近一倍.另外,改进的DPhyp算法结合提出的代价模型,比原始的Impala查询响应时间平均减少67%~80%.
-
关键词
查询超图
代价模型
Impala大数据实时查询
左线性树
执行计划
-
Keywords
query hypergraph
cost model
Impala big data real-time query
left deep tree
execution plan
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-