-
题名一机多芯模块化服务器系统
- 1
-
-
作者
高显扬
吴安
慈潭龙
李金锋
赵伟康
-
机构
浪潮电子信息产业股份有限公司
-
出处
《计算机工程与应用》
北大核心
2025年第5期344-354,共11页
-
文摘
面向多样化应用场景需求和多元算力融合挑战,创新“一机多芯模块化服务器”软硬件体系结构。以服务器系统互连交换为中心,将多元计算单元和系统硬件资源进行解耦池化。通过标准化接口定义和统一控制与管理实现底层硬件差异化集成,实现多元算力协同、资源按需调配、系统统一调度与管理。关键技术包括高性能无阻塞总线互连交换、池化单元长距离低延时互连、内存和存储资源解耦池化、整机系统监控管理和系统资源拓扑管理等。一机多芯模块化服务器系统,可实现全部硬件解耦和弹性组合,实现在服务器系统内兼容多元算力模组以及多元算力和共享资源按需在线调配。实验结果显示一机多芯系统实现了均衡的16卡GPU低延时通信和系统性能线性提升,可面向AI场景实现异构算力按需分配;实现了亚微秒级远端内存访问,扩展了内存带宽和容量,有效提升系统性能;实现了细粒度存储池化资源共享,满足多主机高并发存储应用需求。
-
关键词
一机多芯
模块化服务器
融合架构
硬件解耦
资源池化
异构算力
-
Keywords
multicore
modular server
composable infrastructure
disaggregated system
resource pooling
heterogeneous computing
-
分类号
TP302.1
[自动化与计算机技术—计算机系统结构]
-