针对同步定位与建图(simultaneous localization and mapping,SLAM)技术对计算资源的高需求、有限环境适应性、累积误差问题、系统复杂度高、成本昂贵、大场景处理能力受限以及缺乏有效的回环检测机制的缺点,提出一种结合人工势场法和...针对同步定位与建图(simultaneous localization and mapping,SLAM)技术对计算资源的高需求、有限环境适应性、累积误差问题、系统复杂度高、成本昂贵、大场景处理能力受限以及缺乏有效的回环检测机制的缺点,提出一种结合人工势场法和深度强化学习的方法。利用图论模拟人工势场在机器人间的相互作用以及机器人与目的地之间的势场力,并采用孪生延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法来优化机器人对障碍物信息的感知和处理。仿真试验结果表明:该方法使机器人能够在未知环境中快速、准确地进行定位、移动,同时维持队形的稳定性和一致性。展开更多
本文针对三维环境下采用传统人工势场法(Artificial Potential Field,APF)实现无人机编队路径规划存在的规划效率低及路径震荡的问题,提出一种融合深度强化学习与改进APF的无人机编队路径规划策略。首先,基于双深度Q网络(Double Deep Q-...本文针对三维环境下采用传统人工势场法(Artificial Potential Field,APF)实现无人机编队路径规划存在的规划效率低及路径震荡的问题,提出一种融合深度强化学习与改进APF的无人机编队路径规划策略。首先,基于双深度Q网络(Double Deep Q-Network,DDQN)和优先经验回放机制生成长机的全局最优路径,解决了传统APF的路径非最优问题;其次,通过设计引力系数、斥力系数与步长的自适应调整策略,改进APF以抑制路径震荡,并提升僚机路径的平滑度与收敛效率;最后,以DDQN生成的路径作为虚拟长机,结合改进APF实现多无人机编队的协同避障与路径规划。仿真实验表明,所提出的方法能引导无人机编队在实现避障与避碰的同时到达目标点,每个无人机的平均路径长度为114 m,平均路径平滑度为2.3(°)/m,相比于传统方法有效提升了编队路径的收敛效率与平滑度,且兼顾了路径规划的全局最优性以及编队协同性。展开更多
文摘针对同步定位与建图(simultaneous localization and mapping,SLAM)技术对计算资源的高需求、有限环境适应性、累积误差问题、系统复杂度高、成本昂贵、大场景处理能力受限以及缺乏有效的回环检测机制的缺点,提出一种结合人工势场法和深度强化学习的方法。利用图论模拟人工势场在机器人间的相互作用以及机器人与目的地之间的势场力,并采用孪生延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法来优化机器人对障碍物信息的感知和处理。仿真试验结果表明:该方法使机器人能够在未知环境中快速、准确地进行定位、移动,同时维持队形的稳定性和一致性。