基于密度划分的数据存储方法与技术被引量：16

Data storage method and technology based on density partitioning

在线阅读下载PDF

导出

摘要目前数据量越来越大,存储空间不足,但数据源中带有重复性质的数据比例过高,导致数据的冗余度偏高。为解决这一问题,提出一种基于数据源中数据密度分布不同的密度区域划分算法。将数据源中高密度数据区域进行筛选提取,对此区域中的具有高度重复性质的数据进行降低冗余度的擦除动作,达到降低数量级压缩数据源的目的。实验结果表明,相比传统的数据压缩LZW算法,该算法的数据压缩策略在压缩率与数据适用性上更具优势与灵活性。 At present,the amount of data is more and more large,and the storage space is insufficient,but the proportion of data with repetitive nature in the data source is too high,resulting in the high degree of data redundancy.To solve this problem,a density region division algorithm based on the different density distribution of data in the data source was proposed,which filtered and extracted the high-density data region in the data source,and erased the highly repetitive data in the region to reduce the redundancy,so as to achieve the purpose of reducing the number of compressed data sources.The basic comparison experiment shows that the traditional LZW algorithm has more advantages and flexibility in compression rate and data applicability.

作者赵会群李春良 ZHAO Hui-qun;LI Chun-liang(School of Computer Science,North China University of Technology,Beijing 100144,China)

机构地区北方工业大学计算机学院

出处《计算机工程与设计》北大核心 2020年第9期2482-2487,共6页 Computer Engineering and Design

基金国家自然科学基金项目(61672041)。

关键词数据存储数据压缩数据冗余串表压缩算法密度区域划分 data storage data compression data redundancy LZW density area division

分类号 TP301 [自动化与计算机技术—计算机系统结构]

作者简介赵会群(1960-),男,辽宁沈阳人,博士,教授,研究方向为软件体系结构、物联网;通讯作者:李春良(1993-),男,安徽淮南人,硕士,研究方向为大数据压缩存储。E-mail:1966788058@qq.com。

引文网络
相关文献

参考文献15

1魏巍,刘勇奎,段晓东,郭晨.基于Huffman编码的改进压缩链码[J].计算机应用,2014,34(12):3565-3569. 被引量：3
2伍育红.聚类算法综述[J].计算机科学,2015,42(S1):491-499 524. 被引量：102
3李双庆,慕升弟.一种改进的DBSCAN算法及其应用[J].计算机工程与应用,2014,50(8):72-76. 被引量：29
4郑翠芳.几种常用无损数据压缩算法研究[J].计算机技术与发展,2011,21(9):73-76. 被引量：47
5赵文强,杨百龙,龚世忠,李雪松.一种改进的基于LZW压缩编码的可逆信息隐藏算法[J].计算机应用研究,2017,34(6):1783-1785. 被引量：4
6李宗林,罗可.DBSCAN算法中参数的自适应确定[J].计算机工程与应用,2016,52(3):70-73. 被引量：38
7陈刚,刘秉权,吴岩.一种基于高斯分布的自适应DBSCAN算法[J].微电子学与计算机,2013,30(3):27-30. 被引量：24
8夏秀峰,赵龙.基于三层存储模型的RFID数据压缩存储方法[J].计算机应用,2012,32(3):625-628. 被引量：4
9鄢海舟,胥布工,石东江,郑伟德.无损压缩算法LZW前缀编码优化及应用[J].计算机工程,2017,34(3):299-303. 被引量：11
10陆振龙,张箐.基于大字典的LZW压缩算法的降熵改进[J].计算机应用与软件,2016,33(6):287-290. 被引量：5

二级参考文献135

1金卫民.数据通讯中LZW算法的应用研究[J].计算机工程与科学,2004,26(5):46-48. 被引量：7
2邵春丽,胡鹏,黄承义,彭琪.DELAUNAY三角网的算法详述及其应用发展前景[J].测绘科学,2004,29(6):68-71. 被引量：66
3岳士弘,李平,郭继东,周水庚.A statistical information-based clustering approach in distance space[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2005,6(1):71-78. 被引量：9
4王忠效,姜丹.关于Lempel－Ziv　77压缩算法及其实现的研究[J].计算机研究与发展,1996,33(5):329-340. 被引量：19
5王刚,刘立柱.ZIP文件压缩编码分析[J].微计算机信息,2006(05X):283-285. 被引量：8
6张凤林,刘思峰.LZW＊：一个改进的LZW数据压缩算法[J].小型微型计算机系统,2006,27(10):1897-1899. 被引量：19
7张凤林,刘思峰.Huffman~*:一个改进的Huffman数据压缩算法[J].计算机工程与应用,2007,43(2):73-74. 被引量：19
8刘勇奎,魏巍,郭禾.压缩链码的研究[J].计算机学报,2007,30(2):281-287. 被引量：16
9崔业勤,高建国.基于“虚段”方法的LZ混合无损压缩算法[J].计算机应用与软件,2007,24(3):140-141. 被引量：3
10刘少华,吴东胜,罗小龙,陈华军.Delaunay三角网中点目标快速定位算法研究[J].测绘科学,2007,32(2):69-70. 被引量：28

共引文献299

1张怡霄,郭文普,康凯,姚云龙,王攀.基于聚类与网格搜索的TDOA/DOA联合定位方法[J].战术导弹技术,2020(1):105-112. 被引量：3
2刘英林,陈玉柱,丁文静,程红云.钢卷表面缺陷分布特征发现方法研究[J].冶金自动化,2020,44(1):27-31. 被引量：2
3仇景明,曲桦,赵季红.一种鲁棒网络流量分类及新类型发现算法[J].北京邮电大学学报,2020(2):40-45. 被引量：2
4庄卫东,汪春.农机直线行走作业DGPS导航算法研究[J].黑龙江八一农垦大学学报,2006,18(6):50-53. 被引量：18
5郑文清,陈建华.满足工艺品剪切要求的二维不规则排料算法[J].计算机技术与发展,2008,18(11):26-28. 被引量：1
6齐公玉,邱卫宁,花向红,陈汉坤,刘志武.面积测量设计中地块形状与界址点误差关系[J].测绘信息与工程,2010,35(2):14-16. 被引量：5
7方雷,张华鑫,姚申君.一种基于面积修改简单多边形的算法[J].华东师范大学学报（自然科学版）,2011(2):77-88. 被引量：3
8杨荣华,花向红,邱卫宁,唐琨,耿涛.三维激光扫描仪的任意方向角度分辨率模型研究[J].测绘信息与工程,2011,36(3):11-12. 被引量：4
9吴文强.水声通信数据无损压缩方法的对比研究[J].现代电子技术,2012,35(9):103-105. 被引量：3
10张婕,周佳媚.坐标法计算断面面积的改进研究[J].铁路计算机应用,2012,21(4):46-48. 被引量：2

同被引文献190

1咸鹤群,刘红燕,张曙光,侯瑞涛.可验证的云存储安全数据删重方法[J].软件学报,2020,31(2):455-470. 被引量：10
2王钊,竺佳,金姗,张晓娜,张喆.对象代理数据库的分布式存储负载均衡算法[J].科技通报,2020(11):21-25. 被引量：3
3朱盼盼,张彤,郑宇宁,李姝.分布式存储系统中纠删码数据修复算法优化与实现[J].计算机应用研究,2020,37(S01):140-142. 被引量：7
4吴行斌,郭强,张林兵,梁耀洲,刘建国.基于网络社团划分方法的多维数据聚类研究[J].计算机应用研究,2020,37(2):421-423. 被引量：6
5赵宏,常有康,王伟杰.深度神经网络的对抗攻击及防御方法综述[J].计算机科学,2022,49(S02):662-672. 被引量：9
6龚泯宇,郭世旭,田皓文.基于FPGA的多波束声纳发射机与接收机模块化设计[J].电子测量与仪器学报,2022,36(1):141-148. 被引量：9
7王德波.基于COTS器件的异构冗余星载计算机加固设计[J].电子测量技术,2020(10):1-6. 被引量：1
8郭升,童晓阳.智能变电站线路保护系统检修周期的优化方法研究[J].电网技术,2020,44(2):484-495. 被引量：14
9王皓.智慧城轨云平台和数据平台及网络安全融合协同技术研究[J].都市快轨交通,2022,35(6):64-68. 被引量：10
10蒲天骄,乔骥,韩笑,张国宾,王新迎.人工智能技术在电力设备运维检修中的研究及应用[J].高电压技术,2020,46(2):369-383. 被引量：244

引证文献16

1胡茂美.基于March算法的网络多维数据优化存储方法[J].吉林化工学院学报,2021,38(9):78-81. 被引量：3
2黄永生.基于大数据分析的负载平衡数据分级存储方法[J].河北北方学院学报（自然科学版）,2021,37(11):45-51. 被引量：3
3王永臻.基于最小二乘法的船舶电力监控系统数据压缩策略[J].上海船舶运输科学研究所学报,2022,45(1):28-33. 被引量：2
4常会丽,周金莲.基于MVC架构的多维数据压缩存储方法研究[J].计算机仿真,2022,39(4):279-283. 被引量：11
5梁雪青,杜舒明.基于MapReduce模型的非结构化数据分布式存储方法[J].微型电脑应用,2022,38(7):106-109. 被引量：6
6朱明增,覃秋勤,刘小兰,陈极万.基于函数链传感器网络的多源数据融合变电站管控技术[J].电子设计工程,2022,30(16):116-120. 被引量：1
7马兴明,董成,毛新宇,焦玉新,李浩.基于状态估计的海量多元异构智能电网数据压缩存储方法[J].电机与控制应用,2023,50(2):67-72. 被引量：11
8杨丽华,鄂晶晶,冯锋.云计算任务数据节能存储模型仿真[J].计算机仿真,2023,40(2):535-539. 被引量：4
9李蕾,孙歆.电力数据库信息密度划分的存储风险监测方法[J].自动化与仪器仪表,2023(4):53-57. 被引量：1
10孙金傲,陈茂胜,邹吉炜,孔令波.微小卫星固存控制系统设计与实现[J].电子测量技术,2023,46(10):1-5. 被引量：3

二级引证文献59

1冯欣,李英瑞,王苹,董哲原,辛瑞昊.基于机器学习的小鼠基因位点预测方法研究[J].吉林化工学院学报,2022,39(11):14-19.
2任建桥,宋威,刘泽才.电力数据库信息密度划分的存储风险监测方法研究[J].仪器仪表用户,2024,31(4):110-112.
3姜静思.考虑负载平衡的海量数据信息优化存储方法[J].信息记录材料,2022,23(7):171-173. 被引量：1
4赵泊宁.基于改进变分自编码器的传感器数据快速压缩方法[J].信息与电脑,2022,34(21):70-72.
5熊国栋.基于贪婪算法的网络数据分级储存方法[J].信息记录材料,2023,24(1):229-231.
6崔北鹏,张宝欣,关凯元,李坤龙,陈昕.基于MVC架构的通用型数据处理软件的设计与实现[J].计算机测量与控制,2023,31(3):223-227. 被引量：3
7吕舰.基于国密算法的网络通信传输数据安全存储方法[J].长江信息通信,2023,36(4):171-174. 被引量：10
8薛佳.多媒体数据压缩算法及其实现研究[J].电脑知识与技术,2023,19(14):96-98.
9李想.基于全同态加密算法的高校数据安全存储方法[J].信息与电脑,2023,35(8):208-210. 被引量：3
10张小龙.智能电网中输变电技术应用[J].电力设备管理,2023(14):121-123. 被引量：1

1林丹淳,谭敏,刘凯,柳林,朱远辉.代表性人口空间分布数据集的精度评价——以2010年广东省为例[J].热带地理,2020,40(2):346-356. 被引量：28
2李根.一种叉车智能感知控制系统[J].科技视界,2020(26):133-135.
3王前东.经典轨迹的相似度量快速算法[J].系统工程与电子技术,2020,42(10):2189-2196. 被引量：1
4谷鹏,肖建于,宋香鹏,徐成振.基于关联规则与WPA-BPNN光伏发电功率预测[J].湖北民族大学学报（自然科学版）,2020,38(3):322-327.
5康英伟,段松涛,刘向伟,朱峰,杨平,梁正玉.一元和二元函数的数据建模方法及其在火电机组中的应用[J].上海电力大学学报,2020,36(3):207-213. 被引量：1
6缪巍巍,吴海洋,施健,张华锋.电力IMS中SIP会话性能的研究与优化[J].计算机与数字工程,2020,48(8):2051-2056. 被引量：3
7李燕,全勇男,蔡茂林.微喷嘴射流截面能量密度和信息熵[J].液压与气动,2020,44(9):161-167. 被引量：3
8焦燕飞,张树林,梁庆海.基于线性规划的利税总额预测与目标任务分解研究——以A市烟草公司为例[J].中国商论,2020(18):134-135. 被引量：1
9梁丽强,萨日娜,高峰.变载荷铣削力影响下的加工中心床身结构优化设计[J].机电工程,2020,37(9):1013-1019. 被引量：5
10郑宁,朱红伟,黄德财,史庆藩.漏斗颗粒流的物理因素影响研究[J].中国科学：物理学、力学、天文学,2020,50(9):66-87. 被引量：5

计算机工程与设计

2020年第9期

浏览历史

内容加载中请稍等...

基于密度划分的数据存储方法与技术被引量：16

参考文献15

二级参考文献135

共引文献299

同被引文献190

引证文献16

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

基于密度划分的数据存储方法与技术 被引量：16

参考文献15

二级参考文献135

共引文献299

同被引文献190

引证文献16

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

基于密度划分的数据存储方法与技术被引量：16