期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
Spark上的等值连接优化 被引量:12
1
作者 卞昊穹 陈跃国 +1 位作者 杜小勇 高彦杰 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期263-270,280,共9页
等值连接作为数据分析中最常用、代价最高的操作之一,在Spark上的实现和优化与传统并行数据库有很大的差别,传统并行数据仓库中基于数据预划分的连接算法在Spark上难以实现,而目前被广泛采用的Broadcast Join和Repartition Join性能较差... 等值连接作为数据分析中最常用、代价最高的操作之一,在Spark上的实现和优化与传统并行数据库有很大的差别,传统并行数据仓库中基于数据预划分的连接算法在Spark上难以实现,而目前被广泛采用的Broadcast Join和Repartition Join性能较差,如何提高连接性能成为基于Spark的海量数据分析的关键.本研究将Simi-Join与Partition Join的优势相结合,并基于Spark上的特性提出了一种优化的等值连接算法.代价分析和实验表明本算法比现有基于Spark的数据分析系统中的连接算法性能提升1~2倍. 展开更多
关键词 大数据分析 等值连接 内存计算
在线阅读 下载PDF
跨隐私数据库加密数据等值连接共享协议 被引量:5
2
作者 景旭 李冰冰 何东健 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第8期37-42,共6页
针对管理型SaaS(software as a service)中两个租户公平共享隐私数据的问题,提出一种跨隐私数据库加密数据等值连接共享协议.在该协议中:两个租户通过服务提供方(service provider,SP)用可交换加密函数交换某共有属性的全集,实现属性值... 针对管理型SaaS(software as a service)中两个租户公平共享隐私数据的问题,提出一种跨隐私数据库加密数据等值连接共享协议.在该协议中:两个租户通过服务提供方(service provider,SP)用可交换加密函数交换某共有属性的全集,实现属性值交集共享;SP用该属性值生成的密钥加密对应元组其他属性值后向对方租户分发;租户用交集生成的密钥解密;组合双方属性交集中等值元素的元组,实现两个租户通过不可信SP公平共享隐私数据.完备性、安全性证明和效率分析结果表明,在半诚实模型下,协议安全可证,满足最少必要信息共享条件,计算代价和通信代价分别是用AGRAWAL协议实现公平共享的57%和75%. 展开更多
关键词 隐私数据库 加密数据 等值连接 信息共享 SAAS
在线阅读 下载PDF
基于Spark的两表等值连接过程优化 被引量:1
3
作者 张子栋 郑延斌 《计算机应用研究》 CSCD 北大核心 2019年第2期486-489,共4页
在数据统计分析查询中表间的等值连接是常用的操作之一,但代价较高。大数据环境下大表之间等值连接的效率更低。为了解决该问题,提出了一种基于Spark的两表等值连接过程优化方法。首先根据数据价值密度特征构建Bloom filter完成表的过... 在数据统计分析查询中表间的等值连接是常用的操作之一,但代价较高。大数据环境下大表之间等值连接的效率更低。为了解决该问题,提出了一种基于Spark的两表等值连接过程优化方法。首先根据数据价值密度特征构建Bloom filter完成表的过滤操作;其次结合simi-join和partition join两者的优势,对过滤后的单侧表使用贪心算法进行拆分;最后对拆分后的子集进行连接,因此把两大表的连接过程转换为分阶段进行的两小表连接。代价分析和实验结果表明,该算法与现有基于Spark的连接操作相比,不仅在性能上得到了提升,而且当出现数据倾斜时对算法效率影响较小。 展开更多
关键词 SPARK 等值连接 大数据 优化 拆分
在线阅读 下载PDF
跨加密关系数据库等值连接大小共享协议
4
作者 景旭 李书琴 谭戈旭 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2014年第3期95-101,共7页
针对管理型SaaS中2个租户需要公平共享等值连接大小的问题,提出了等值连接大小的组合公式和跨加密关系数据库等值连接大小共享协议。在该协议中,由一个共享属性及对应元组其它属性的哈希值构成2元组,SP将其全集发给对方租户;对2元组中... 针对管理型SaaS中2个租户需要公平共享等值连接大小的问题,提出了等值连接大小的组合公式和跨加密关系数据库等值连接大小共享协议。在该协议中,由一个共享属性及对应元组其它属性的哈希值构成2元组,SP将其全集发给对方租户;对2元组中的共享属性值再次加密后,租户发送给对方;租户分别计算共享属性值的密文交集以及元素对应各租户的元组数;利用等值连接大小的组合公式,2个租户公平共享了等值连接大小。完整性和安全性证明表明,协议在半诚实模型下安全可证,满足最少必要信息共享条件。效率分析表明,协议计算代价和通信代价仅是通过Agrawal协议实现公平共享的50%和约68%。原型测试可看出,协议基本能满足管理型SaaS的需求。 展开更多
关键词 关系数据库 加密数据 等值连接大小 共享协议 SAAS
在线阅读 下载PDF
面向多属性的不等值连接操作算法 被引量:1
5
作者 孟庆强 何浩奇 +2 位作者 毕倪飞 赵斌 吉根林 《计算机工程》 CAS CSCD 北大核心 2019年第6期60-66,共7页
为降低多属性不等值连接操作的计算代价,提出一种基于属性优选的不等值连接操作算法MIEJoin。按照连接属性对元组进行排序,计算各连接属性的候选集大小,在最小候选集中根据连接谓词进行筛选得到最终的结果集。在此基础上,为提升系统的... 为降低多属性不等值连接操作的计算代价,提出一种基于属性优选的不等值连接操作算法MIEJoin。按照连接属性对元组进行排序,计算各连接属性的候选集大小,在最小候选集中根据连接谓词进行筛选得到最终的结果集。在此基础上,为提升系统的缓存命中率,提出一种缓存敏感的多属性不等值连接算法CMIEJoin。基于MIEJoin算法建立元组的排列顺序数组,在内存中邻近存储连续访问的数据,以降低缓存的缺失次数并提升算法的运行效率。在TPC-H数据集上的实验结果表明,与BIEJoin算法和NLJoin算法相比,CMIEJoin算法具有较高的运行效率。 展开更多
关键词 等值查询 等值连接 最小候选集 缓存敏感算法 查询处理
在线阅读 下载PDF
一种构建StreamCube的超大维表连接算法 被引量:2
6
作者 甘亮 贾焰 +1 位作者 李爱平 金鑫 《计算机研究与发展》 EI CSCD 北大核心 2011年第1期55-67,共13页
表连接是关系数据库中最重要的操作之一,在数据流管理系统中同样重要.构建StreamCube的聚集查询时,数据流与超大维表(如IPaddress维表)作表连接将耗费大量有限的计算资源和内存.超大维表需划分为多个块,分块读入内存,造成磁盘I/O频繁.... 表连接是关系数据库中最重要的操作之一,在数据流管理系统中同样重要.构建StreamCube的聚集查询时,数据流与超大维表(如IPaddress维表)作表连接将耗费大量有限的计算资源和内存.超大维表需划分为多个块,分块读入内存,造成磁盘I/O频繁.根据维表及其连接键层的特性,降低维表与数据流连接的连接键冗余,将维表无损压缩为可装入内存的连接键范围维表(RJ-DT),引出数据流上非等值连接问题;并提出一种超大维表多表连接算法——多动态索引嵌套循环连接算法(multi dynamicindex nested-loopjoin),该算法实现数据流与压缩维表高效的非等值连接,并拓展为多表连接.理论分析及实验结果表明,该算法可使超大维表连接性能明显改善,最高可达到一个数量级的加速并具有很强的实用性. 展开更多
关键词 压缩维表 StreamCube 面向列的数据库 等值连接 网络安全
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部