本文针对三维环境下采用传统人工势场法(Artificial Potential Field,APF)实现无人机编队路径规划存在的规划效率低及路径震荡的问题,提出一种融合深度强化学习与改进APF的无人机编队路径规划策略。首先,基于双深度Q网络(Double Deep Q-...本文针对三维环境下采用传统人工势场法(Artificial Potential Field,APF)实现无人机编队路径规划存在的规划效率低及路径震荡的问题,提出一种融合深度强化学习与改进APF的无人机编队路径规划策略。首先,基于双深度Q网络(Double Deep Q-Network,DDQN)和优先经验回放机制生成长机的全局最优路径,解决了传统APF的路径非最优问题;其次,通过设计引力系数、斥力系数与步长的自适应调整策略,改进APF以抑制路径震荡,并提升僚机路径的平滑度与收敛效率;最后,以DDQN生成的路径作为虚拟长机,结合改进APF实现多无人机编队的协同避障与路径规划。仿真实验表明,所提出的方法能引导无人机编队在实现避障与避碰的同时到达目标点,每个无人机的平均路径长度为114 m,平均路径平滑度为2.3(°)/m,相比于传统方法有效提升了编队路径的收敛效率与平滑度,且兼顾了路径规划的全局最优性以及编队协同性。展开更多