期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向时序SMART不平衡数据的硬盘故障预测算法
1
作者 李国 侯雪雪 +1 位作者 李静 陈辉 《郑州大学学报(理学版)》 北大核心 2025年第3期19-27,共9页
针对数据存储中心硬盘故障数据稀少造成的故障预测效果不佳的问题,面向自我检测分析与报告技术(self-monitoring analysis and reporting technology,SMART)数据信息的时序特征,提出一种通过数据增强解决不平衡问题的硬盘故障预测算法... 针对数据存储中心硬盘故障数据稀少造成的故障预测效果不佳的问题,面向自我检测分析与报告技术(self-monitoring analysis and reporting technology,SMART)数据信息的时序特征,提出一种通过数据增强解决不平衡问题的硬盘故障预测算法。该算法利用长短期记忆网络改进传统的生成对抗网络,生成包含故障恶化趋势信息的序列段数据,解决了数据集不平衡问题。同时,为进一步提高预测性能,预测模型融合了时序注意力机制和特征注意力机制,挖掘不同SMART特征和时间步对硬盘故障恶化过程的敏感程度。此外,在特征选择阶段结合了多种典型特征选择算法来选取关键特征。在真实硬盘数据集上进行了实验验证,结果表明,所提算法的准确率、召回率和F 1值均有较大提升。 展开更多
关键词 不平衡数据 数据增强 硬盘故障预测 生成对抗网络 注意力机制
在线阅读 下载PDF
融合AP聚类算法和宽度学习系统的分布外硬盘故障预测 被引量:1
2
作者 王屹阳 刘发贵 +1 位作者 彭玲霞 钟国祥 《计算机科学》 CSCD 北大核心 2024年第8期63-74,共12页
硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段。但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往... 硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段。但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往不适用于其他硬盘。对于这两个问题,文中提出了一种融合AP聚类算法和宽度学习系统的分布外硬盘故障预测方法。针对样本不平衡问题,文中使用AP聚类算法对硬盘故障出现前一阶段的样本集进行聚类,将与故障样本处于同一聚类簇的样本扩充为故障样本。针对不同型号硬盘分布存在差异的问题,文中结合流形正则化框架和宽度学习系统来学习硬盘数据的低维结构,提高模型对未知分布数据的泛化能力。实验结果表明,在AP聚类算法重采样的样本集上,相较于用于对比的重采样方法得到的样本集,多种故障预测方法的F1_Score取得了平均0.2的提升。此外,在分布外硬盘故障预测任务上,所提模型的F1_Score相比对比方法提升了0.1~0.2。 展开更多
关键词 硬盘故障预测 类不平衡 分布外泛化 AP聚类 宽度学习系统 流形学习
在线阅读 下载PDF
一种硬盘故障预测的非监督对抗学习方法 被引量:10
3
作者 姜少彬 杜春 +2 位作者 陈浩 李军 伍江江 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2020年第2期118-125,共8页
为解决传统监督学习方法在不均衡数据集异常检测上易出现过拟合的问题,提出一种非监督对抗学习方法用于硬盘故障预测。该方法使用长短期记忆神经网络和全连接层设计了一种可进行二次编码的自编码器,只需使用正常样本进行训练,通过减小... 为解决传统监督学习方法在不均衡数据集异常检测上易出现过拟合的问题,提出一种非监督对抗学习方法用于硬盘故障预测。该方法使用长短期记忆神经网络和全连接层设计了一种可进行二次编码的自编码器,只需使用正常样本进行训练,通过减小样本重构误差和潜在向量之间的距离,使模型学习正常样本的数据分布,从而提高了模型的泛化能力。模型中还引入生成式对抗网络增强非监督学习的效果。在多个数据集上的对比实验显示,该方法对异常样本的召回率和精确度都高于传统的监督学习和半监督学习分类器,泛化能力更强。所以,该非监督对抗学习方法在硬盘故障预测上是有效的。 展开更多
关键词 异常检测 硬盘故障预测 生成式对抗网络 非监督学习
在线阅读 下载PDF
硬盘故障预测模型在大型数据中心环境下的验证 被引量:7
4
作者 贾宇晗 李静 +4 位作者 贾润莹 李忠伟 王刚 刘晓光 肖康 《计算机研究与发展》 EI CSCD 北大核心 2015年第S2期54-61,共8页
随着互联网的发展、存储规模的骤增,大型数据中心硬盘频繁损坏导致的数据丢失给企业带来的损失已成为不可忽视的重大问题.以往基于硬盘SMART(self-monitoring,analysis and reporting technology)属性建立的包括应用统计学和机器学习等... 随着互联网的发展、存储规模的骤增,大型数据中心硬盘频繁损坏导致的数据丢失给企业带来的损失已成为不可忽视的重大问题.以往基于硬盘SMART(self-monitoring,analysis and reporting technology)属性建立的包括应用统计学和机器学习等方法在内的各种硬盘故障预测模型,虽然取得了较好的效果,但其数据采集及处理等方面均存在不足之处.基于某真实的互联网大型数据中心环境,提取SMART属性数据,并提出了一种基于神经网络权值矩阵的方法,结合Rank Sum秩和检验、RAT反向安排测试、Z-Score评分3种无参统计学方法,对属性进行选择,应用CART决策树及BP神经网络2种机器学习方法,建立硬盘故障预测模型.实验表明描述的2种硬盘故障预测模型均具有很好的性能,这是机器学习算法在实际应用场景下很好的实践.此外,通过实验以及对实验的分析和解释,得出一些有益的结论,这为下一步的研究工作奠定了基础. 展开更多
关键词 硬盘故障预测 决策树 BP神经网络 SMART 大型数据中心
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部