期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
分布式机器学习系统网络性能优化研究进展
被引量:
15
1
作者
王帅
李丹
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第7期1384-1411,共28页
以机器学习为代表的人工智能技术需要对海量数据进行处理,对底层算力要求极高.分布式机器学习通过将计算任务分布式地部署到多个计算节点来加快模型的训练速度,从而将训练任务完成时间降低到可接受范围.由于通信开销对分布式机器学习系...
以机器学习为代表的人工智能技术需要对海量数据进行处理,对底层算力要求极高.分布式机器学习通过将计算任务分布式地部署到多个计算节点来加快模型的训练速度,从而将训练任务完成时间降低到可接受范围.由于通信开销对分布式机器学习系统的扩展性具有重要影响,因此,分布式机器学习系统网络性能优化受到各界研究者的广泛关注.本文首先分析了分布式机器学习系统扩展性不足的主要原因,并提出了改善其扩展性的关键思路,然后系统地综述了分布式机器学习系统网络性能优化相关的研究工作,并对这些研究工作从多个角度进行了对比分析.最后,对分布式机器学习系统网络性能优化研究的未来发展趋势进行了展望.
展开更多
关键词
分布式机器学习系统
网络优化
参数同步
通信调度
网内聚合
在线阅读
下载PDF
职称材料
题名
分布式机器学习系统网络性能优化研究进展
被引量:
15
1
作者
王帅
李丹
机构
清华大学计算机科学与技术系
北京信息科学与技术国家研究中心
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第7期1384-1411,共28页
基金
国家重点研发计划项目(2018YFB1800500)
广东省重点领域研发计划项目(2018B010113001)
+1 种基金
国家自然科学基金项目(61772305)
清华大学-中国移动联合研究院项目资助.
文摘
以机器学习为代表的人工智能技术需要对海量数据进行处理,对底层算力要求极高.分布式机器学习通过将计算任务分布式地部署到多个计算节点来加快模型的训练速度,从而将训练任务完成时间降低到可接受范围.由于通信开销对分布式机器学习系统的扩展性具有重要影响,因此,分布式机器学习系统网络性能优化受到各界研究者的广泛关注.本文首先分析了分布式机器学习系统扩展性不足的主要原因,并提出了改善其扩展性的关键思路,然后系统地综述了分布式机器学习系统网络性能优化相关的研究工作,并对这些研究工作从多个角度进行了对比分析.最后,对分布式机器学习系统网络性能优化研究的未来发展趋势进行了展望.
关键词
分布式机器学习系统
网络优化
参数同步
通信调度
网内聚合
Keywords
distributed machine learning system
network optimization
parameter synchronization
communication scheduling
in-network aggregation
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
分布式机器学习系统网络性能优化研究进展
王帅
李丹
《计算机学报》
EI
CAS
CSCD
北大核心
2022
15
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部