-
题名面向多核CPU和GPU平台的数据库星形连接优化
被引量:5
- 1
-
-
作者
刘专
韩瑞琛
张延松
陈跃国
张宇
-
机构
数据工程与知识工程教育部重点实验室(中国人民大学)
中国人民大学信息学院
中国人民大学中国调查与数据中心
中国气象局国家卫星气象中心
-
出处
《计算机应用》
CSCD
北大核心
2021年第3期611-617,共7页
-
基金
国家自然科学基金资助项目(61772533,61732014)
北京市自然科学基金资助项目(4192066)。
-
文摘
针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量索引的CPU和GPU平台上的向量化星形连接算法;然后,通过面向CPU cache和GPU shared memory大小的向量划分来提出基于向量粒度的星形连接操作,从而优化星形连接中向量索引的物化代价;最后,提出了基于压缩向量的星形连接算法,将定长向量索引压缩为变长的二元向量索引,从而在低选择率时提高cache内向量索引的存储访问效率。实验结果表明,在CPU平台上向量化星形连接算法相对于常规的行式或列式连接性能提升了40%以上,在GPU平台上向量化星形连接算法相对于常规星形连接算法性能提升超过了15%;与当前主流的内存数据库和GPU数据库相比,优化的星形连接算法性能相对于最优内存数据库Hyper性能提升了130%,相对于最优的GPU数据库OmniSci性能提升了80%。可见基于向量索引的向量化星形连接优化技术有效地提高了多表连接性能,与传统优化技术相比,基于向量索引的向量化处理提高了较小cache上的数据存储访问效率,压缩向量进一步提升了向量索引在cache内的访问效率。
-
关键词
联机分析处理
星形连接
向量化查询处理
向量压缩技术
异构计算
-
Keywords
On-Line Analytical Processing(OLAP)
star-join
vectorized query processing
vector compression technique
heterogeneous computing
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-