-
题名重复数据删除技术的存储空间利用率测评研究
被引量:4
- 1
-
-
作者
阳小珊
朱立谷
张琦琮
郑良
邱全伟
汤占坤
-
机构
国家电子计算机质量监督检验中心(中国电子科技集团公司第十五研究所)
中国传媒大学计算机学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第S1期187-194,共8页
-
基金
国家科技支撑计划基金项目(2011BAH04B05)
-
文摘
在大数据时代,为了提高存储空间利用率,重复数据删除技术被广泛应用.然而,重复数据删除技术的重删效果如何评价,它对存储系统的存储空间利用率影响程度如何等问题,目前还没有有效的测评指标和测评方法来解决.为此,对3种典型的重复数据删除技术进行了分析,研究了存储空间利用率的测评指标和测评方法,然后通过理论分析和真实数据实验对其可行性和有效性进行了验证.分析和实验结果表明:设计的测评指标和测评方法实际可行,能定量的评估存储空间利用率,有利于数据中心存储效率的提高,从而实现绿色存储和节能减排,并能减少企业的资源浪费和提高投资回报率.
-
关键词
重复数据删除技术
存储空间利用率
存储测评
绿色存储
大数据
-
Keywords
data de-duplication technology
storage space utilization
green storage
big data
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP333
[自动化与计算机技术—计算机系统结构]
-
-
题名基于擦除编码和副本复制的分布式混合存储研究
- 2
-
-
作者
付雄
宋朝阳
王俊昌
邓松
-
机构
南京邮电大学计算机学院
-
出处
《计算机科学》
北大核心
2025年第2期42-47,共6页
-
基金
国家自然科学基金(61602264)
江苏省重点研发计划(社会发展)(BE2017743)。
-
文摘
随着大数据技术、云计算、计算机技术和网络技术的迅猛发展,互联网数据呈爆炸性增长,海量数据的高效存储成为当前互联网技术亟待解决的问题。然而,传统的多副本冗余机制导致了巨大的存储成本,引起了研究者们对新型存储解决方案的关注。在这一背景下,提出了一种基于擦除编码和副本复制的分布式混合存储策略。该策略根据数据特性,对热数据采用副本复制以确保高可靠性和性能,而对冷数据则采用擦除编码以提高存储利用率。基于牛顿冷却定律将数据文件划分为热文件和冷文件,并引入一种自适应的数据温度识别及冷热数据自适应动态分配算法,使系统能够在运行时自动调整冷热数据的比例,然后根据实时数据冷热情况智能调整数据的存储策略,体现了系统在动态环境下的自适应性。其不仅增强了系统对动态工作负载的适应能力,也为提高分布式存储系统在实际应用中的效率和灵活性提供了新的范式。这一创新点在学术和实践层面都具有重要的推动意义。同时,通过仿真实验验证了该策略的有效性和可用性,其为分布式存储系统的优化提供了新的思路。
-
关键词
大数据
副本复制
擦除编码
冷热数据
存储利用率
-
Keywords
Big data
Replica replication
Erasure coding
Hot and cold data
Storage utilization rate
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名存储系统中的纠删码研究综述
被引量:94
- 3
-
-
作者
罗象宏
舒继武
-
机构
清华大学计算机科学与技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第1期1-11,共11页
-
基金
国家自然科学基金项目(60925006
60873066)
+1 种基金
国家"八六三"高技术研究发展计划基金重大项目(2009AA01A403)
Intel国际合作项目(Intel-CRC-2010-06)
-
文摘
随着海量存储系统的发展和在复杂环境中的应用,存储系统的可靠性受到了严重的挑战.纠删码作为存储系统容错的主要方法越来越受到重视.首先介绍了当前典型和常见的纠删码技术的发展现状,从评价纠删码性能的各项重要指标的角度详细地对比和分析了现有的纠删码技术,给出了不同纠删码在容错能力与磁盘要求、空间利用率、编码效率、更新效率、重构效率等方面的不足和可能的改进见解,并讨论了磁盘阵列系统、P2P存储系统、分布式存储系统、归档存储系统等不同存储系统对于纠删码各类性能的差别要求,并进一步指明了当前存储系统纠删码研究中尚未解决的一些难题和未来纠删码可能的发展方向.通过分析得出,目前不同纠删码在容错能力、计算效率、存储利用率等方面都存在不同程度的缺陷,如何平衡这些影响纠删码性能的因素,设计出更高容错能力、更高计算效率及更高存储利用率的纠删码,仍是未来很长一段时间内值得不断深入研究的问题.
-
关键词
存储系统
纠删码
容错率
存储利用率
计算效率
-
Keywords
storage systems
erasure code
fault tolerance
storage efficiency
computation efficiency
-
分类号
TP302.8
[自动化与计算机技术—计算机系统结构]
-
-
题名延缓B-树生成过程中结点分裂的算法
被引量:2
- 4
-
-
作者
罗心
乐晓波
-
机构
长沙交通学院
-
出处
《湖南教育学院学报》
2000年第2期28-32,共5页
-
文摘
B-树的生成过程中结点的分裂会降低生成过程的系统运行效率和存储利用率.延缓B-树生成过程中结点的分裂,可大大减少给点分裂的次数,减少组织和维护结点分裂后的系统开销,从而可提高B-树的存储利用率和检索效率.
-
关键词
B-树
算法
分裂
存储利用率
生成过程
结点
-
Keywords
B-tree
algorithm
fission
space utilisation
-
分类号
TP311.12
[自动化与计算机技术—计算机软件与理论]
-