-
题名GASNet通信系统的研究与改进
- 1
-
-
作者
李家宝
姜小成
谢余强
-
机构
解放军信息工程大学信息工程学院
江南计算技术研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2005年第12期91-93,共3页
-
文摘
全局地址空间网络(GASNet)是一种用于Berkeley UPC语言的可移植高性能的通信系统[1]。通过对该系统分析,对其单边通信进行了优化,优化后性能提高近42%。此外,还对通信与计算的重叠技术进行了探讨。
-
关键词
gasNet
UPC
亲缘性
单边
通信系统
-
Keywords
global-address space networking Unified parallel C Affinity One-sided
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
TN914
[电子电信—通信与信息系统]
-
-
题名一种面向高性能计算机的超节点控制器的研究
被引量:4
- 2
-
-
作者
王凯
陈飞
李强
李晓民
安学军
孙凝晖
-
机构
中国科学院计算技术研究所
中国科学院计算机系统结构重点实验室(中国科学院计算技术研究所)
中国科学院研究生院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第1期1-8,共8页
-
基金
国家自然科学基金重点项目(60633040)
国家"八六三"高技术研究发展计划基金项目(2006AA01A102)
-
文摘
传统高性能计算机的节点由一个处理单元和一个节点控制器组成.为了有效地维护高速缓存一致性,处理单元中的处理器个数会非常有限.因此一台具有千万亿次处理能力的高性能计算机将会有上万个节点,这对互连网络的延迟和带宽都提出了非常高的要求.超节点控制器能够同时连接多个处理单元构成一个超节点,这能够减小互连网络的规模,从而降低互连网络的设计难度,并保证互连网络的性能.用FPGA实现了超节点控制器的原型系统的测试结果表明,采用超节点设计的高性能计算机拥有非常低的通信延迟,同时其通信带宽也有非常好的扩展性.
-
关键词
高性能计算机
超节点控制器
全局地址空间
直接内存访问
远程读写
-
Keywords
high performance computer
hyper-node controller
global address space
direct memory access
remote load store
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名基于全局地址空间的高效I/O虚拟化方法研究
- 3
-
-
作者
李波
孟丹
霍志刚
-
机构
中国科学院计算技术研究所国家智能计算机研究开发中心
中国科学院计算机系统结构重点实验室
中国科学院研究生院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2011年第11期2274-2279,共6页
-
基金
曙光6000千万亿次高效能计算机系统研制项目(2009AA01A129)资助
超并行计算机体系结构研究项目(60633040)资助
-
文摘
针对多操作系统核心下网络I/O资源的高效共享问题,提出的基于全局地址空间的I/O虚拟化方法.方法采用了半虚拟化的设计思想,基于全局地址空间支持,主、从核心在通信的关键路径上均可对网络设备直接发起I/O操作,从而获得最佳的I/O虚拟化性能.本文以HPP结构为实例,研究了将提出的I/O虚拟化方法应用到HPP结构下对InfiniBand网络进行虚拟化的关键技术,实现了从核心I/O通信时的OS旁路和主核心旁路.对曙光6000原型系统的测试表明,在主、从核心配置相同的情况下,从核心使用虚拟化InfiniBand的通信性能与主核心相当,I/O虚拟化对应用性能的影响小于2%.
-
关键词
多核心
HPP结构
全局地址空间
OS-bypass
半虚拟化
-
Keywords
multi-kernel
HPP architecture
global address space
OS-bypass
para-virtualization
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名龙芯2E多处理器芯片组的设计与实现
- 4
-
-
作者
方志斌
胡鹏
安学军
孙凝晖
-
机构
中国科学院计算技术研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第5期1465-1469,1473,共6页
-
基金
中国科学院创新课题资助项目(20054010)
中国科学院计算技术研究所创新课题资助项目(20046080)
-
文摘
提出了一种面向高性能计算机的多处理器芯片组的设计,其主要特点是支持多处理器通过芯片组和交换芯片两级互连,全局地址空间和多处理器同步支持。给出了芯片组的组成结构、设计原则和关键技术,设计并实现了基于龙芯2E处理器的多处理器芯片组。目前,已采用FPGA平台对该芯片组进行验证和测试,以该芯片组为核心的四处理器原型系统完成B IOS引导和操作系统运行,经过实测处理器的访问请求通过芯片组延迟小于0.5μs,芯片组内处理器通信带宽达到500 Mbps。
-
关键词
多处理器
芯片组
全局地址空间
龙芯2E处理器
-
Keywords
multi-processor
chipset
global address space (gas)
Godson 2E CPU
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-