期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
超级计算机系统实时节能控制技术的理论与实践研究 被引量:1
1
作者 金士尧 张冬松 吴飞 《计算机工程与科学》 CSCD 北大核心 2012年第8期24-31,共8页
本文提出了一种解决超级计算机中系统级节能问题的方案,采用共享计算机资源实时任务执行概率和节点机安全切入和切出机制,实现了超级计算机系统中负载检测统计和预测以及节能安全决策。初步实验表明,本文提出的节能安全决策方法可以实... 本文提出了一种解决超级计算机中系统级节能问题的方案,采用共享计算机资源实时任务执行概率和节点机安全切入和切出机制,实现了超级计算机系统中负载检测统计和预测以及节能安全决策。初步实验表明,本文提出的节能安全决策方法可以实现较多节能,其节能效果受限于具体的系统模型、开销模型和负载预测结果。 展开更多
关键词 超级计算机系统 实时概率调度理论 系统切入和切出节能控制
在线阅读 下载PDF
面向超级计算机系统的大规模图遍历优化 被引量:2
2
作者 谭雯 甘新标 +4 位作者 白皓 肖调杰 陈旭光 雷书梦 刘杰 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2021年第6期84-95,共12页
现实中的数据问题通常被抽象为图。在大数据时代,图数据趋于复杂,这是因为数据量大幅提升,所需要的计算规模迅速增长。大规模的图数据问题对超算平台的存储运算能力具有广泛需求,并对此提出了更高的要求。为了高效地处理大规模图数据,... 现实中的数据问题通常被抽象为图。在大数据时代,图数据趋于复杂,这是因为数据量大幅提升,所需要的计算规模迅速增长。大规模的图数据问题对超算平台的存储运算能力具有广泛需求,并对此提出了更高的要求。为了高效地处理大规模图数据,发挥天河超级计算机实验平台的图处理能力,基于现实世界中图结构的小世界性和无尺度性特征,面向评测超级计算机图处理能力的重要基准Graph500,提出一种主要应用于大规模图的图遍历优化方法。这一方法结合了天河平台的体系结构特征,在图结构上应用了顶点排序和优先缓存策略,即将图中顶点按度数从高到低排序,令程序在图遍历阶段优先访问高度数邻居顶点,并将部分关键高度数顶点缓存至天河系统核组内的高速缓存中,以此来减少Graph500基准程序中的无效访存,降低进程间的通信开销,提高访存带宽利用率,从而有效地提升Graph500基准测试程序在天河平台上的性能。面向天河超级计算机系统实验平台提出的应用顶点排序与优先缓存优化方法的VS-Graph500程序,其加速的效果显著,可扩展性好。当图测试规模为2^(37)时,全系统稳定测试性能为2547.13 GTEPS,超过2020年11月Graph500国际排名榜上第7名的数据。 展开更多
关键词 Graph500基准 图结构 顶点排序 优先缓存 超级计算机系统
在线阅读 下载PDF
“深超-21C”超级计算机系统在我校投入使用
3
作者 坪梓 《深圳大学学报(理工版)》 EI CAS 北大核心 2005年第2期148-148,共1页
深圳大学与清华大学合作研制的“深超-21C”超级计算机系统日前在我校投入使用.“深超-21C”采用集群式超级计算机结构,由128个计算结点组成,每个计算结点为双CPU的SMP服务器,结点之间以3种互联网络连接:①高速的Myrinet2000(传输... 深圳大学与清华大学合作研制的“深超-21C”超级计算机系统日前在我校投入使用.“深超-21C”采用集群式超级计算机结构,由128个计算结点组成,每个计算结点为双CPU的SMP服务器,结点之间以3种互联网络连接:①高速的Myrinet2000(传输速率达2Gbits/s,传输线采用先进的光纤,网卡采用光电转换技术)传递计算时的数据消息; 展开更多
关键词 超级计算机系统 投入使用 光电转换技术 计算机结构 合作研制 清华大学 深圳大学 双CPU 传输速率 网络连接 集群式 结点 服务器 SMP 传输线 互联 数据 网卡
在线阅读 下载PDF
英特尔和惠普联手打造世界最高效超级计算机
4
《计算机研究与发展》 EI CSCD 北大核心 2012年第10期2094-2094,共1页
惠普和英特尔联手为美国国家能源部可再生能源实验室(NREL)N:计和建造了一个新的超级计算机系统,该系统将是世界上最高效的系统之一.新系统将采用目前的32纳米XeonE5处理器和未来的22纳米IvyBridge处理器的组合,再加上约600个Xeon... 惠普和英特尔联手为美国国家能源部可再生能源实验室(NREL)N:计和建造了一个新的超级计算机系统,该系统将是世界上最高效的系统之一.新系统将采用目前的32纳米XeonE5处理器和未来的22纳米IvyBridge处理器的组合,再加上约600个XeonPhi协同处理器(基于英特尔的MIC架构),在惠普ProLiant第8代服务器内运行. 展开更多
关键词 超级计算机系统 英特尔 惠普 世界 32纳米 可再生能源 处理器 实验室
在线阅读 下载PDF
圆周率计算世界新纪录诞生
5
《计算机研究与发展》 EI CSCD 北大核心 2009年第10期1703-1703,共1页
日前,筑波大学研究人员借助最新的超级计算机系统,将圆周率计算到小数点后25769.8037亿位,打破了东京大学和日立制作所于2002年创下的小数点后12411亿位的世界纪录.筑波大学副教授高桥大介等研究人员将640台高性能计算机连接起来... 日前,筑波大学研究人员借助最新的超级计算机系统,将圆周率计算到小数点后25769.8037亿位,打破了东京大学和日立制作所于2002年创下的小数点后12411亿位的世界纪录.筑波大学副教授高桥大介等研究人员将640台高性能计算机连接起来,形成一个每秒可进行约95万亿次运算的并行超级计算机系统.研究人员用这套系统仅花费73小时36分就创下了圆周率计算世界新纪录。 展开更多
关键词 超级计算机系统 世界纪录 圆周率 研究人员 东京大学 计算机连接 日立制作所 小数点
在线阅读 下载PDF
国外海洋预报动态
6
作者 任湘湘 夏冬冬 《海洋预报》 北大核心 2012年第3期83-84,共2页
1日本气象厅超级计算机升级 日本气象厅JMA于2012年6月5日正式开始运行日立(HITACHI)最新一代超级计算机系统,为防灾减灾和航空提供更高质量的气象信息服务。新系统HITACHI SR16000/M1,
关键词 海洋预报 超级计算机系统 HITACHI 日本气象厅 国外 气象信息服务 计算机升级 防灾减灾
在线阅读 下载PDF
卷积神经网络并行方法研究 被引量:2
7
作者 朱传家 刘鑫 方佳瑞 《计算机应用与软件》 北大核心 2020年第11期209-214,共6页
随着训练数据集的增大和神经网络的日益复杂,训练深度神经网络非常耗时,在有效的时间内训练深度神经网络成为一大挑战。卷积神经网络具有网络参数分布不均匀的特点。提出一种同时使用数据并行和模型并行的卷积神经网络并行方法,并基于... 随着训练数据集的增大和神经网络的日益复杂,训练深度神经网络非常耗时,在有效的时间内训练深度神经网络成为一大挑战。卷积神经网络具有网络参数分布不均匀的特点。提出一种同时使用数据并行和模型并行的卷积神经网络并行方法,并基于国产超级计算机系统和深度学习框架Caffe进行实验。实验结果表明,对某些全连接层,使用模型并行相比使用数据并行加速可达33倍。 展开更多
关键词 卷积神经网络 并行方法 数据并行 模型并行 国产超级计算机系统
在线阅读 下载PDF
深圳市获2004年度广东省科学技术奖28项
8
作者 坪梓 《深圳大学学报(理工版)》 EI CAS 北大核心 2005年第4期302-302,共1页
关键词 科学技术奖 广东省 深圳市 自主创新能力 传染性非典型肺炎 国际先进水平 广州地铁二号线 超级计算机系统 科技项目
在线阅读 下载PDF
Programming for scientific computing on peta-scale heterogeneous parallel systems 被引量:1
9
作者 杨灿群 吴强 +2 位作者 唐滔 王锋 薛京灵 《Journal of Central South University》 SCIE EI CAS 2013年第5期1189-1203,共15页
Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to co... Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to conduct computational experiments of historic significance, these systems are presently difficult to program. The users, who are domain experts rather than computer experts, prefer to use programming models closer to their domains (e.g., physics and biology) rather than MPI and OpenME This has led the development of domain-specific programming that provides domain-specific programming interfaces but abstracts away some performance-critical architecture details. Based on experience in designing large-scale computing systems, a hybrid programming framework for scientific computing on heterogeneous architectures is proposed in this work. Its design philosophy is to provide a collaborative mechanism for domain experts and computer experts so that both domain-specific knowledge and performance-critical architecture details can be adequately exploited. Two real-world scientific applications have been evaluated on TH-IA, a peta-scale CPU-GPU heterogeneous system that is currently the 5th fastest supercomputer in the world. The experimental results show that the proposed framework is well suited for developing large-scale scientific computing applications on peta-scale heterogeneous CPU/GPU systems. 展开更多
关键词 heterogeneous parallel system programming framework scientific computing GPU computing molecular dynamic
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部