期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
大型高能物理计算集群资源管理方法的评测 被引量:7
1
作者 孙震宇 石京燕 +2 位作者 姜晓巍 邹佳恒 杜然 《计算机科学》 CSCD 北大核心 2017年第10期85-90,共6页
高能物理数据由物理事例组成,事例之间没有相关性。可以通过大量作业同时处理大量不同的数据文件,从而实现高能物理计算任务的并行化,因此高能物理计算是典型的高吞吐量计算场景。高能所计算集群使用开源的TORQUE/Maui进行资源管理及作... 高能物理数据由物理事例组成,事例之间没有相关性。可以通过大量作业同时处理大量不同的数据文件,从而实现高能物理计算任务的并行化,因此高能物理计算是典型的高吞吐量计算场景。高能所计算集群使用开源的TORQUE/Maui进行资源管理及作业调度,并通过将集群资源划分成不同队列以及限制用户最大运行作业数来保证公平性,然而这也导致了集群整体资源利用率非常低下。SLURM和HTCondor都是近年来流行的开源资源管理系统,前者拥有丰富的作业调度策略,后者非常适合高吞吐量计算,二者都能够替代老旧、缺乏维护的TORQUE/Maui,都是管理计算集群资源的可行方案。在SLURM和HTCondor测试集群上模拟大亚湾实验用户的作业提交行为,对SLURM和HTCondor的资源分配行为和效率进行了测试,并与相同作业在高能物理研究所TORQUE/Maui集群上的实际调度结果进行了对比,分析了SLURM及HTCondor的优势和不足,探讨了使用SLURM或HTCondor管理高能物理研究所计算集群的可行性。 展开更多
关键词 资源管理系统 作业调度器 计算集群 高吞吐量计算 能物理计算
在线阅读 下载PDF
采用增量检查点技术改进Condor检查点机制的研究 被引量:3
2
作者 张光辉 王丽娟 陈姗 《河南农业大学学报》 CAS CSCD 北大核心 2010年第6期718-721,共4页
分析了集群作业系统Condor中的检查点机制的实现原理,针对其在执行检查点操作时存在的对计算资源和存储资源的利用的不足,提出了使用增量检查点技术对其进行优化的方案,使得每次进行检查点操作时,只需要保存同上次检查点操作相比改变了... 分析了集群作业系统Condor中的检查点机制的实现原理,针对其在执行检查点操作时存在的对计算资源和存储资源的利用的不足,提出了使用增量检查点技术对其进行优化的方案,使得每次进行检查点操作时,只需要保存同上次检查点操作相比改变了的数据,这样可以大大降低检查点操作的空间开销和时间开销,最后通过1个矩阵运算的实例验证了改进方案的可行性. 展开更多
关键词 机群 CONDOR 高吞吐量计算 增量检查点技术
在线阅读 下载PDF
基于Condor的密集数据处理系统的实现
3
作者 欧阳娅 孙瑞志 杨璐 《计算机应用》 CSCD 北大核心 2007年第B12期270-271,274,共3页
计算密集型作业的资源管理系统Condor是一个能创建高吞吐量计算(HTC)环境的软件系统。设计和构建了一个基于Condor的密集数据处理系统,为大型密集数据提供了一个高性能的处理平台,提高了处理的效率。通过对实验结果的分析,充分说明了基... 计算密集型作业的资源管理系统Condor是一个能创建高吞吐量计算(HTC)环境的软件系统。设计和构建了一个基于Condor的密集数据处理系统,为大型密集数据提供了一个高性能的处理平台,提高了处理的效率。通过对实验结果的分析,充分说明了基于Condor的密集数据处理系统在处理密集数据时具有一定的高效性。 展开更多
关键词 CONDOR 高吞吐量计算 密集数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部