-
题名三数据中心下的纠删码算法研究
- 1
-
-
作者
孙婧
牛虹婷
梁松涛
-
机构
华东政法大学智能科学与信息法学系
北京航空航天大学计算机学院
上海哔哩哔哩科技有限公司多媒体技术中心
-
出处
《计算机科学》
北大核心
2025年第2期48-57,共10页
-
基金
国家自然科学基金(12161080)
数据恢复四川省重点实验室开放基金项目(DRN2204)。
-
文摘
纠删码算法在单数据中心和多数据中心得到了广泛的应用。目前对纠删码算法的研究更多地关注存储成本和修复带宽,对于如何在专线带宽、交换机受限的情况下完成多数据中心之间的修复,如何在可靠性、容错能力等核心因素之间实现最佳权衡等问题,没有进行充分的分析和解决。针对三数据中心这种最常用的多数据中心场景,首先,提出了纠删码在系统设计中重要的4个因素:冗余度、可靠性、容错能力及解码带宽。其次,根据提出的4个因素,设计了一种单数据中心下满足最优带宽修复的S-LRC算法。再根据提出的S-LRC算法,设计了满足三中心架构体系下的G-LRC算法。相比传统的编码方案,提出的G-LRC算法具有更高的可靠性、更大的容错性及解码带宽惩罚比。其两节点故障时解码带宽惩罚比仅为传统方案的1/7~2/7。最后,将G-LRC算法在大文件存储系统中进行了实现和验证,并且设计了解码最优决策算法来减少修复的带宽,解决了非最大距离可分割码算法在系统中落地难的问题。
-
关键词
三数据中心
纠删码
局部可修复码
最大可恢复编码
REED-SOLOMON码
-
Keywords
Three data center
Erasure code
Local reconstruction code
Maximum recovery code
Reed-solomon code
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-