期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向跨智算集群互联的新型HIC-OTN技术
1
作者 张德朝 孙将 +3 位作者 曹珊 左铭青 王东 李晗 《电信科学》 北大核心 2025年第4期53-60,共8页
随着全球AI产业蓬勃发展,大模型技术对算力需求越来越高,国内外大型科技公司正积极投建超万卡/超十万卡集群。超十万卡集群的发展受限于水电供应、建设投入等因素,而通过高速全光网构建多集群互联的基础网络底座,实现跨集群高效协同训... 随着全球AI产业蓬勃发展,大模型技术对算力需求越来越高,国内外大型科技公司正积极投建超万卡/超十万卡集群。超十万卡集群的发展受限于水电供应、建设投入等因素,而通过高速全光网构建多集群互联的基础网络底座,实现跨集群高效协同训练是重要的潜在解决方案。为满足跨智算集群互联超大带宽、超低时延、超高可靠需求,提出了无损智算光传送网(hitless intelligent computing optical transport network,HIC-OTN)的技术架构及关键技术方案,并基于HIC-OTN完成了首个104 km跨智算集群流水线并行(pipeline parallelism,PP)拉远训练现网技术试验,探索和验证了百公里级跨集群PP训练的可行性。基于800 Gbit/s HIC-OTN互联在52 km和104 km两个智算集群场景下,HIC-OTN完成了等同单节点训练效率98%以上的高效协同训练,并实现了光网络保护倒换对训练效率的无损和无感知。 展开更多
关键词 跨集群训练 HIC-OTN 无损保护 超大带宽 超低时延
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部