期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
HPN:阿里云大模型训练网络架构
1
作者 钱坤 翟恩南 操佳敏 《中兴通讯技术》 北大核心 2024年第6期63-67,共5页
介绍了阿里云用于大型语言模型(LLM)训练的数据中心网络架构高性能网络(HPN)。HPN通过双上联、多轨、双平面的网络架构设计,避免了单链路故障带来的严重连通性影响,并且避免了哈希极化的产生。实验表明,HPN将LLM训练的端到端性能提升超... 介绍了阿里云用于大型语言模型(LLM)训练的数据中心网络架构高性能网络(HPN)。HPN通过双上联、多轨、双平面的网络架构设计,避免了单链路故障带来的严重连通性影响,并且避免了哈希极化的产生。实验表明,HPN将LLM训练的端到端性能提升超过14.9%。HPN已在阿里的生产环境中部署了超过1年。 展开更多
关键词 大模型训练 网络架构 数据中心网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部