-
题名HashMap优化及其在列存储数据库查询中的应用
被引量:9
- 1
-
-
作者
母红芬
李征
霍卫平
金正皓
-
机构
北京化工大学计算机系
北京东方国信科技股份有限公司
-
出处
《计算机科学与探索》
CSCD
北大核心
2016年第9期1250-1261,共12页
-
基金
国家自然科学基金Nos.61170082
61472025
+1 种基金
教育部新世纪优秀人才支持计划No.NCET-12-0757
教育部留学回国人员科研启动基金No.LXJJ201303~~
-
文摘
HashMap在基本字典操作中具有常数级别的平均算法时间复杂度,广泛应用于大数据的检索。Block_HashMap(BHMap)基于C++HashMap,其优化包括三方面:哈希函数选取,冲突解决和关键字匹配。优化核心在于冲突解决时,以链地址法为基础,提出了一种高效利用高速缓存的存储结构Block_List来存储冲突的数据,并且预先缓存哈希值,节省匹配时间。实验证明,在桶数目充足的情况下,BHMap会多消耗少部分内存,但在桶数目有限,数据重复率比较低的情况下,时间性能上相对C++标准模板库中的Map提升10倍以上,比unordered_map快3.5倍以上,且消耗的内存与unordered_map相差不大。在列存储数据库分组和连接查询中,关键字的分桶、解决冲突和匹配操作也都涉及到基于哈希的技术,最终把BHMap应用到列存储数据库的关键查询中。
-
关键词
哈希图
分组
连接
缓存感知
缓存不敏感
列存储数据库
BHMap
-
Keywords
Hash Map
group by
join
cache-conscious
cache-oblivious
column-oriented database
BHMap
-
分类号
TP311.132.3
[自动化与计算机技术—计算机软件与理论]
-