期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
SHELL:一种面向流数据的实时基数估计算法
1
作者 刘尚东 张殿超 +4 位作者 尧海昌 姚橹 叶青 季一木 王汝传 《南京邮电大学学报(自然科学版)》 北大核心 2017年第4期91-96,共6页
基数计算在流数据查询优化、网络安全、数据压缩等领域具有重要的应用价值。现有的基于概率统计原理的基数估计算法需要通过扫描历史静态数据才能进行基数统计,由于流数据具有持续、快速和实时等特点,不可能先持久化再处理分析,因而传... 基数计算在流数据查询优化、网络安全、数据压缩等领域具有重要的应用价值。现有的基于概率统计原理的基数估计算法需要通过扫描历史静态数据才能进行基数统计,由于流数据具有持续、快速和实时等特点,不可能先持久化再处理分析,因而传统的基数估计算法无法直接应用在大数据流处理中。通过研究Spark、Storm实时分布式流处理机制和传统基数估计算法,设计和实现了实时的流数据基数估计算法SHELL(Streaming HypErLogLog),实验表明,SHELL在保证精确度不降低的情况下,单位滑动时间窗口内处理的消息量达到6.0×10~5~6.8×10~5,满足实时性处理的要求。 展开更多
关键词 大数据处理技术 流数据 基数估计 并行化算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部