期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于张量Tucker分解的智能配电网大数据压缩 被引量:21
1
作者 赵洪山 马利波 《中国电机工程学报》 EI CSCD 北大核心 2019年第16期4744-4752,共9页
为了解决智能配电网中由海量异构数据引发的存储问题,提出一种基于张量Tucker分解的智能配电网数据压缩方法。首先,针对配电网异构数据建立配电网结构化SCADA数据与非结构化视频、图片数据的张量标准化处理模型。然后,提出基于张量Tucke... 为了解决智能配电网中由海量异构数据引发的存储问题,提出一种基于张量Tucker分解的智能配电网数据压缩方法。首先,针对配电网异构数据建立配电网结构化SCADA数据与非结构化视频、图片数据的张量标准化处理模型。然后,提出基于张量Tucker分解的配电网大数据压缩方法,该方法可以在保留数据空间本征结构的情况下对配电网异构数据进行压缩。最后,采用真实的配电网数据验证了所提出方法可以有效削减数据量以应对数据存储问题。对比结果表明,所提出方法优于奇异值分解方法。 展开更多
关键词 大数据压缩 智能配电网 张量Tucker分解 异构数据标准化 空间本征结构
在线阅读 下载PDF
压缩数据上的关系代数操作算法 被引量:2
2
作者 丁鑫哲 张兆功 +2 位作者 李建中 谭龙 刘勇 《计算机应用》 CSCD 北大核心 2016年第1期21-26,51,共7页
针对在大数据管理中,在压缩的数据上无需解压即可进行相关操作的问题,在数据服从正态分布的前提下,根据列数据存储的特点,提出了一种新的面向列存储的压缩方法——CCA。首先,通过对列数据的长度进行归类;然后,采用抽样的方法获得重复度... 针对在大数据管理中,在压缩的数据上无需解压即可进行相关操作的问题,在数据服从正态分布的前提下,根据列数据存储的特点,提出了一种新的面向列存储的压缩方法——CCA。首先,通过对列数据的长度进行归类;然后,采用抽样的方法获得重复度较高的前缀;最后,使用字典编码进行压缩,提出了列索引(CI)和列实体(CR)作为数据压缩结构来降低大数据存储的空间需求,从而直接有效地在压缩数据上支持选择、投影、连接等基本操作,并实现了基于CCA的数据库原型系统——D-DBMS。理论分析和在1 TB数据上的实验结果表明,该压缩算法能够显著提高大数据的存储效率和数据操作性能,与BAP和TIDC压缩方法相比,在压缩率分别提高了51%、14%;在执行速度上提高了47%、42%。 展开更多
关键词 大数据压缩 列索引 列实体 关系代数操作
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部