期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
大模型训练技术综述 被引量:10
1
作者 田海东 张明政 +1 位作者 常锐 童贤慧 《中兴通讯技术》 北大核心 2024年第2期21-28,共8页
实现高效训练已成为影响大模型应用普及的关键要素之一。按照数据准备、数据加载、模型初始化及评估、训练并行、模型状态保存的一般训练流程,对大模型高效训练的主要技术进行分析和论述。面对大模型规模的持续增长、数据处理类型的扩展... 实现高效训练已成为影响大模型应用普及的关键要素之一。按照数据准备、数据加载、模型初始化及评估、训练并行、模型状态保存的一般训练流程,对大模型高效训练的主要技术进行分析和论述。面对大模型规模的持续增长、数据处理类型的扩展,现有大模型训练技术仍存在较大的优化空间。认为未来大模型训练重点研究方向包括以数据为中心、数据加载智能化和异构加速、网络通信领域定制、训练并行及自动化。 展开更多
关键词 大模型 数据准备 数据加载 模型初始化 模型评估 训练并行 训练网络 检查点
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部