-
题名基于扰动流体与TD3的无人机路径规划算法
被引量:3
- 1
-
-
作者
陈康雄
刘磊
-
机构
河海大学
-
出处
《电光与控制》
CSCD
北大核心
2024年第1期57-62,共6页
-
基金
国家自然科学基金(61976084)。
-
文摘
针对双延迟深度确定性策略梯度(TD3)算法存在的动作选取随机性低的问题,在TD3算法中依正态分布进行动作选取,并依据扰动流体路径规划方法在路径平滑度上较高的优势,提出一种基于扰动流体与TD3算法的无人机路径规划框架,将其用于解决动态未知环境下的无人机路径规划问题,实现了无人机路径规划方案的快速收敛。仿真结果表明,对算法的改进可大幅提升网络训练效率,且能在保证避障实时性的前提下,满足航迹质量需求,为路径规划任务中应用深度强化学习提供了新思路。
-
关键词
无人机
路径规划
双延迟深度确定性策略梯度算法
深度强化学习
扰动流体动态系统
-
Keywords
UAV
path planning
twin delayed deep deterministic policy gradient algorithm
deep reinforcement learning
interfered fluid dynamic system
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名无人机反应式扰动流体路径规划
被引量:17
- 2
-
-
作者
吴健发
王宏伦
王延祥
刘一恒
-
机构
北京航空航天大学自动化科学与电气工程学院
北京控制工程研究所空间智能控制技术重点实验室
北京航空航天大学飞行器控制一体化技术重点实验室
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2023年第2期272-287,共16页
-
基金
国家自然科学基金(62173022,61673042,61175084)资助。
-
文摘
针对复杂三维障碍环境,提出一种基于深度强化学习的无人机(Unmanned aerial vehicles,UAV)反应式扰动流体路径规划架构.该架构以一种受约束扰动流体动态系统算法作为路径规划的基本方法,根据无人机与各障碍的相对状态以及障碍物类型,通过经深度确定性策略梯度算法训练得到的动作网络在线生成对应障碍的反应系数和方向系数,继而可计算相应的总和扰动矩阵并以此修正无人机的飞行路径,实现反应式避障.此外,还研究了与所提路径规划方法相适配的深度强化学习训练环境规范性建模方法.仿真结果表明,在路径质量大致相同的情况下,该方法在实时性方面明显优于基于预测控制的在线路径规划方法.
-
关键词
无人机
反应式路径规划
受约束扰动流体动态系统
深度强化学习
训练环境
-
Keywords
Unmanned aerial vehicle(UAV)
reactive path planning
constrained interfered fluid dynamical system
deep reinforcement learning
training environments
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于MATD3的无人机智能协同路径规划方法
被引量:2
- 3
-
-
作者
杨闰麟
陈才轶
郭正玉
罗德林
-
机构
厦门大学航空航天学院
中国空空导弹研究院
空基信息感知与融合全国重点实验室
-
出处
《厦门大学学报(自然科学版)》
北大核心
2025年第2期241-252,共12页
-
基金
空基信息感知与融合全国重点实验室与航空科学基金联合资助项目(20220001068001)。
-
文摘
[目的]多无人机协同路径规划是多无人机应用的关键技术之一,本文旨在研究三维动态环境下的多无人机智能协同路径规划和优化方法.[方法]本文提出了一种基于搜索的扰动流体动态系统(SIFDS)与速度控制策略结合的路径规划算法.该方法通过SIFDS方法将多障碍物环境简化为单障碍物环境,并生成由反应系数构成的无人机动作空间;再结合速度控制策略实现无人机间的时间协同;最后利用多智能体双延迟深度确定性策略梯度(multi-agent twin delaged deep deterministic policy gradient,MATD3)算法,训练得到的动作网络在线生成最优的反应系数,以此提高多无人机路径规划的质量与效率.[结果]本文所提出的方法能够在三维动态环境下使多无人机规划出安全且互不干扰的路径;引入MATD3后,无人机路径更短且平滑;速度控制策略能够控制各无人机同时到达的时间误差在测量精度0.5 s以下.[结论]本文所提出的方法,能够使多无人机在规划路径的同时满足时间协同、空间协同的约束,实现了多无人机协同路径规划,且具有较强的稳定性,为多无人机系统在复杂任务中的实际应用提供了一定的技术支持和理论参考.
-
关键词
无人机
协同路径规划
扰动流体动态系统
强化学习
-
Keywords
UAV
collaborative path planning
interfered fluid dynamic system
reinforcement learning
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-