期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
大规模计算系统故障特征及容错机制分析 被引量:3
1
作者 武林平 罗红兵 刘勇鹏 《计算机工程与科学》 CSCD 北大核心 2009年第A01期237-240,共4页
本文围绕国内外若干大规模计算系统的运行稳定性状况展开调研:首先根据若干典型系统的故障数据,从故障模式、故障特征方面对目前实际生产性系统的稳定性进行分析;然后,在总结目前系统级容错研究思路的基础上,分析了未来更大规模计算系... 本文围绕国内外若干大规模计算系统的运行稳定性状况展开调研:首先根据若干典型系统的故障数据,从故障模式、故障特征方面对目前实际生产性系统的稳定性进行分析;然后,在总结目前系统级容错研究思路的基础上,分析了未来更大规模计算系统容错机制的挑战及可能的解决方案。 展开更多
关键词 大规模计算系统 故障 容错 断点续算
在线阅读 下载PDF
一种面向大规模计算机的监控管理系统 被引量:7
2
作者 郑明玲 蒋句平 +1 位作者 袁远 李宝峰 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第4期107-113,共7页
随着超级计算机系统性能的提升,系统规模越来越大,如何高效管理这些系统成为高性能计算机亟待解决的关键问题之一.本文提出了一种针对大规模计算机的监控管理系统——MMS(Monitoring and Management System).MMS采用分布式系统结构来提... 随着超级计算机系统性能的提升,系统规模越来越大,如何高效管理这些系统成为高性能计算机亟待解决的关键问题之一.本文提出了一种针对大规模计算机的监控管理系统——MMS(Monitoring and Management System).MMS采用分布式系统结构来提高监控管理系统的效率;监控信息的精细化处理降低了监控系统对计算网络的影响同时提高了基于web的客户端的反应速度;两级异步通信机制提高了MMS系统数据采集效率.理论分析与实验结果表明MMS运行效率高、可靠性好. 展开更多
关键词 大规模计算系统 计算机资源管理 带外管理 分布式系统结构
在线阅读 下载PDF
大规模并行计算机系统性能测评体系 被引量:2
3
作者 刘杰 迟利华 +3 位作者 蒋杰 徐涵 晏益慧 胡庆丰 《计算机工程与科学》 CSCD 北大核心 2013年第3期25-30,共6页
复杂的大规模并行计算机系统需要能客观反映系统性能的测评方法,单个指标难以全面评价系统的性能特点。从用户需求出发,给出了大规模并行计算机系统用户适用性概念,利用适用性概念,建立了大规模系统性能测评体系,包括总体适用性、分项... 复杂的大规模并行计算机系统需要能客观反映系统性能的测评方法,单个指标难以全面评价系统的性能特点。从用户需求出发,给出了大规模并行计算机系统用户适用性概念,利用适用性概念,建立了大规模系统性能测评体系,包括总体适用性、分项适用性、适用性概念、准则和Benchmark程序。整个测评体系尽量消除主观因素,做到客观定量,利用测评体系,借助性能分析数据获取工具,在得到量化的分项适用性的基础上,通过权重公式可以求出总体适用性,根据总体适用性的大小来判断不同大规模计算机系统是否满足用户的需求。 展开更多
关键词 性能测评 大规模并行计算系统 用户适用性
在线阅读 下载PDF
一种大规模分布式计算负载均衡策略 被引量:7
4
作者 杨际祥 谭国真 +1 位作者 王凡 周美娜 《电子学报》 EI CAS CSCD 北大核心 2012年第11期2226-2231,共6页
大规模和超大规模计算系统中的通讯延迟成为影响负载均衡性能的一个重要因素,且延迟具有时变性,而传统的负载均衡策略通常假设通讯固定不变或不考虑通讯延迟开销.本文考虑了系统的通讯延迟开销和延迟时变性特征,给出一种基于广义神经网... 大规模和超大规模计算系统中的通讯延迟成为影响负载均衡性能的一个重要因素,且延迟具有时变性,而传统的负载均衡策略通常假设通讯固定不变或不考虑通讯延迟开销.本文考虑了系统的通讯延迟开销和延迟时变性特征,给出一种基于广义神经网络(GNN)的层次结构负载均衡策略.该策略具有三个特点:(1)通讯优化的层次结构能够降低大规模计算系统的负载均衡开销;(2)考虑了节点计算速率及通讯延迟时变特性;(3)通过延迟预测可优化任务的通讯延迟和迁移延迟开销.仿真实验验证了该策略在通讯和负载均衡开销方面的性能. 展开更多
关键词 大规模计算系统 层次结构负载均衡 广义神经网络(GNN)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部