系统异构性和统计异构性的存在使得通信开销和通信效率成为联邦学习的关键瓶颈之一,在众多参与方中只选取一部分客户端执行模型更新和聚合可以有效降低通信开销,但是选择偏差和客户端上的数据质量分布不平衡对客户端采样方法提出了额外...系统异构性和统计异构性的存在使得通信开销和通信效率成为联邦学习的关键瓶颈之一,在众多参与方中只选取一部分客户端执行模型更新和聚合可以有效降低通信开销,但是选择偏差和客户端上的数据质量分布不平衡对客户端采样方法提出了额外的挑战。为此,提出数据质量评估的高效强化联邦学习节点动态采样优化方法(client dynamic sampling optimization of efficient reinforcement federated learning based on data quality assessment,RQCS),该方法采用沙普利值的贡献指数评估客户端上的数据质量,基于深度强化学习模型,智能的动态选择具有高数据质量且能提高最终模型精度的客户端参与每一轮的联邦学习,以抵消数据质量分布不平衡引入的偏差,加速模型收敛并提高模型精度。在MNIST及CIFAR-10数据集上的实验表明,所提出算法与其他算法相比,在减少通信开销的同时进一步加快了收敛速度,同时在模型最终准确性上也有较好的性能。展开更多
在当今数字化时代,开源技术、开源软件和开源社区日益重要,而通过量化分析方法研究开源领域的问题也已经成为一个重要的趋势。开发者是开源项目中的核心,其贡献度的量化以及量化后的贡献度提升策略,是开源项目能够健康发展的关键。文中...在当今数字化时代,开源技术、开源软件和开源社区日益重要,而通过量化分析方法研究开源领域的问题也已经成为一个重要的趋势。开发者是开源项目中的核心,其贡献度的量化以及量化后的贡献度提升策略,是开源项目能够健康发展的关键。文中提出了一种数据驱动的开源贡献度量化评估与持续优化方法,并通过一个实际的工具框架Rosstor(Robotic Open Source Software Mentor)进行了实现。该框架包含两个主要部分:1)贡献度评估模型,采取了熵权法,可以动态客观地评估开发者的贡献度;2)贡献度持续优化模型,采取了深度强化学习方法,最大化了开发者的贡献度。文中选取了GitHub上若干著名的开源项目的贡献者数据,通过大量且充分的实验验证了Rosstor不仅能够使所有项目上开发者的贡献度得到大幅度提升,而且还具有一定的抗干扰性,充分证明了所提方法和框架的有效性。Rosstor框架为当下广泛开展的开源项目和开源社区的可持续健康发展提供了方法和工具方面的支持。展开更多
文摘系统异构性和统计异构性的存在使得通信开销和通信效率成为联邦学习的关键瓶颈之一,在众多参与方中只选取一部分客户端执行模型更新和聚合可以有效降低通信开销,但是选择偏差和客户端上的数据质量分布不平衡对客户端采样方法提出了额外的挑战。为此,提出数据质量评估的高效强化联邦学习节点动态采样优化方法(client dynamic sampling optimization of efficient reinforcement federated learning based on data quality assessment,RQCS),该方法采用沙普利值的贡献指数评估客户端上的数据质量,基于深度强化学习模型,智能的动态选择具有高数据质量且能提高最终模型精度的客户端参与每一轮的联邦学习,以抵消数据质量分布不平衡引入的偏差,加速模型收敛并提高模型精度。在MNIST及CIFAR-10数据集上的实验表明,所提出算法与其他算法相比,在减少通信开销的同时进一步加快了收敛速度,同时在模型最终准确性上也有较好的性能。
文摘在当今数字化时代,开源技术、开源软件和开源社区日益重要,而通过量化分析方法研究开源领域的问题也已经成为一个重要的趋势。开发者是开源项目中的核心,其贡献度的量化以及量化后的贡献度提升策略,是开源项目能够健康发展的关键。文中提出了一种数据驱动的开源贡献度量化评估与持续优化方法,并通过一个实际的工具框架Rosstor(Robotic Open Source Software Mentor)进行了实现。该框架包含两个主要部分:1)贡献度评估模型,采取了熵权法,可以动态客观地评估开发者的贡献度;2)贡献度持续优化模型,采取了深度强化学习方法,最大化了开发者的贡献度。文中选取了GitHub上若干著名的开源项目的贡献者数据,通过大量且充分的实验验证了Rosstor不仅能够使所有项目上开发者的贡献度得到大幅度提升,而且还具有一定的抗干扰性,充分证明了所提方法和框架的有效性。Rosstor框架为当下广泛开展的开源项目和开源社区的可持续健康发展提供了方法和工具方面的支持。