检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

Resilio:一种大模型弹性训练容错系统: 1; 作者李焱杨偲乐 +9 位作者刘成春王林梅田瑶琳张信航朱昱李莼蒲孙磊颜深根肖利民张伟丰《计算机研究与发展》北大核心 2025年第6期1380-1395,共16页; 具备千亿级参数的大型语言模型正在引领当今人工智能与异构计算的技术革新及商业模式的深刻转变.然而,大模型训练任务需要长时间占用大量的硬件资源,软硬件故障发生的频率高且类型较多,并且故障原因难定位导致训练中断时间较长.针对大... 展开更多; 关键词大模型训练深度学习容错故障检测弹性训练自动并行; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	Resilio:一种大模型弹性训练容错系统	李焱杨偲乐刘成春王林梅田瑶琳张信航朱昱李莼蒲孙磊颜深根肖利民张伟丰	《计算机研究与发展》北大核心	2025	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析