-
题名大规模集群硬盘故障预测可迁移性研究
- 1
-
-
作者
胡思源
徐尔茨
李东升
刘锋
张一鸣
-
机构
国防科技大学计算机学院
国防科技大学并行与分布处理国防科技重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第2期505-512,共8页
-
基金
国家自然科学基金项目(62102424)资助。
-
文摘
硬盘驱动器(HDD)仍然是大型数据中心与超算中心主要和重要的存储部件,而存储集群规模地持续扩大对硬盘故障预测的研究不断提出挑战.当前,前人已使用统计学、机器学习和深度学习等不同类型的故障预测方法用于大规模存储集群的硬盘故障预测,并取得不俗的研究结果.但是,对于故障模型的迁移性与数据集差异的相关研究还较少.我们收集了多种类型的HDD数据集与基于不同策略的模型,对其进行交叉实验验证,在模型迁移性、数据集预处理和模型参数方面获得了相关实验结果,例如:数据集在回溯时间与平衡度上的设置显著影响一定程度的预测模型性能,而模型参数设置则并不敏感;模型在不同数据集之间的可迁移性强弱不定,而数据集特征类型和数量的选择更影响预测模型性能.
-
关键词
硬盘故障
故障预测
机器学习与深度学习
迁移性
数据集处理
-
Keywords
hard disk failure
fault prediction
machine learning and deep learning
mobility
dataset processing
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-