-
题名EP-DDPG引导的着舰控制系统
- 1
-
-
作者
雷元龙
谢鹏
刘业华
陈翃正
朱静思
盛守照
-
机构
南京航空航天大学自动化学院
-
出处
《控制理论与应用》
北大核心
2025年第10期1904-1913,共10页
-
基金
航空科学基金项目(20220058052002)资助。
-
文摘
针对舰载机纵向通道下的控制精度提升问题,本文以保证舰载机以合理的姿态和速度沿期望下滑道着落为目标,以深度确定性策略梯度算法为基本优化框架,提出了一种基于专家策略–深度确定性策略梯度(EP-DDPG)算法的控制器参数自适应调节策略.首先,构建“魔毯”着舰控制系统作为基础架构;其次,为提升控制器的自适应能力和鲁棒性,基于行动者–评论家框架设计深度确定性策略梯度(DDPG)算法对控制器参数进行在线调整;最后,针对常规强化学习算法前期训练效率低,效果差的问题,基于反向传播(BP)神经网络构专家策略为智能体的训练提供引导,并设计指导探索协调模块进行策略决策,保证动作策略的合理性和算法的高效性.仿真结果表明,与常规控制器相比,该算法的控制精度和鲁棒性有了极大的提升.
-
关键词
强化学习
深度确定性策略梯度算法
魔毯
行动者–评论家
BP神经网络
-
Keywords
reinforcement learning
deep deterministic policy gradient algorithm
MAGIC CARPET
actor-critic
BP neural network
-
分类号
V271.4
[航空宇航科学与技术—飞行器设计]
V249.1
[航空宇航科学与技术—飞行器设计]
-