为了满足物联网(Internet of Things,IoT)系统的用户设备计算需求,使用携带移动边缘计算服务器的无人机(Unmanned Aerial Vehicle,UAV)协同用户设备进行任务卸载。针对用户设备存在的数据隐私和数据开销问题,引入联邦学习进行模型训练...为了满足物联网(Internet of Things,IoT)系统的用户设备计算需求,使用携带移动边缘计算服务器的无人机(Unmanned Aerial Vehicle,UAV)协同用户设备进行任务卸载。针对用户设备存在的数据隐私和数据开销问题,引入联邦学习进行模型训练。针对计算资源分配不合理的现象,考虑了用户公平性,基于Jain公平指数引入了公平性因子。通过联合优化每架无人机的飞行轨迹和卸载决策,共同最大化系统的总能耗和覆盖范围内的用户公平性,并提出了一种结合Actor-Critic网络的联邦强化学习算法(Federated Reinforcement Learning Combined with Actor-Critic Network,FRLACN),使用Actor-Critic为每个设备生成最优决策动作,进行了更精确的梯度更新,充分利用其异构资源。仿真结果表明,所提FRLACN算法相比传统联邦学习算法降低了11%的总能耗,数据传输成本方面减少了8.7%,并提高了用户公平性。展开更多