期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于扰动流体与TD3的无人机路径规划算法 被引量:3
1
作者 陈康雄 刘磊 《电光与控制》 CSCD 北大核心 2024年第1期57-62,共6页
针对双延迟深度确定性策略梯度(TD3)算法存在的动作选取随机性低的问题,在TD3算法中依正态分布进行动作选取,并依据扰动流体路径规划方法在路径平滑度上较高的优势,提出一种基于扰动流体与TD3算法的无人机路径规划框架,将其用于解决动... 针对双延迟深度确定性策略梯度(TD3)算法存在的动作选取随机性低的问题,在TD3算法中依正态分布进行动作选取,并依据扰动流体路径规划方法在路径平滑度上较高的优势,提出一种基于扰动流体与TD3算法的无人机路径规划框架,将其用于解决动态未知环境下的无人机路径规划问题,实现了无人机路径规划方案的快速收敛。仿真结果表明,对算法的改进可大幅提升网络训练效率,且能在保证避障实时性的前提下,满足航迹质量需求,为路径规划任务中应用深度强化学习提供了新思路。 展开更多
关键词 无人机 路径规划 双延迟深度确定性策略梯度算法 深度强化学习 扰动流体动态系统
在线阅读 下载PDF
无人机反应式扰动流体路径规划 被引量:17
2
作者 吴健发 王宏伦 +1 位作者 王延祥 刘一恒 《自动化学报》 EI CAS CSCD 北大核心 2023年第2期272-287,共16页
针对复杂三维障碍环境,提出一种基于深度强化学习的无人机(Unmanned aerial vehicles,UAV)反应式扰动流体路径规划架构.该架构以一种受约束扰动流体动态系统算法作为路径规划的基本方法,根据无人机与各障碍的相对状态以及障碍物类型,通... 针对复杂三维障碍环境,提出一种基于深度强化学习的无人机(Unmanned aerial vehicles,UAV)反应式扰动流体路径规划架构.该架构以一种受约束扰动流体动态系统算法作为路径规划的基本方法,根据无人机与各障碍的相对状态以及障碍物类型,通过经深度确定性策略梯度算法训练得到的动作网络在线生成对应障碍的反应系数和方向系数,继而可计算相应的总和扰动矩阵并以此修正无人机的飞行路径,实现反应式避障.此外,还研究了与所提路径规划方法相适配的深度强化学习训练环境规范性建模方法.仿真结果表明,在路径质量大致相同的情况下,该方法在实时性方面明显优于基于预测控制的在线路径规划方法. 展开更多
关键词 无人机 反应式路径规划 受约束扰动流体动态系统 深度强化学习 训练环境
在线阅读 下载PDF
基于MATD3的无人机智能协同路径规划方法 被引量:2
3
作者 杨闰麟 陈才轶 +1 位作者 郭正玉 罗德林 《厦门大学学报(自然科学版)》 北大核心 2025年第2期241-252,共12页
[目的]多无人机协同路径规划是多无人机应用的关键技术之一,本文旨在研究三维动态环境下的多无人机智能协同路径规划和优化方法.[方法]本文提出了一种基于搜索的扰动流体动态系统(SIFDS)与速度控制策略结合的路径规划算法.该方法通过SI... [目的]多无人机协同路径规划是多无人机应用的关键技术之一,本文旨在研究三维动态环境下的多无人机智能协同路径规划和优化方法.[方法]本文提出了一种基于搜索的扰动流体动态系统(SIFDS)与速度控制策略结合的路径规划算法.该方法通过SIFDS方法将多障碍物环境简化为单障碍物环境,并生成由反应系数构成的无人机动作空间;再结合速度控制策略实现无人机间的时间协同;最后利用多智能体双延迟深度确定性策略梯度(multi-agent twin delaged deep deterministic policy gradient,MATD3)算法,训练得到的动作网络在线生成最优的反应系数,以此提高多无人机路径规划的质量与效率.[结果]本文所提出的方法能够在三维动态环境下使多无人机规划出安全且互不干扰的路径;引入MATD3后,无人机路径更短且平滑;速度控制策略能够控制各无人机同时到达的时间误差在测量精度0.5 s以下.[结论]本文所提出的方法,能够使多无人机在规划路径的同时满足时间协同、空间协同的约束,实现了多无人机协同路径规划,且具有较强的稳定性,为多无人机系统在复杂任务中的实际应用提供了一定的技术支持和理论参考. 展开更多
关键词 无人机 协同路径规划 扰动流体动态系统 强化学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部