期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
环境风利用的浮空器区域驻留深度强化学习控制方法
1
作者 柏方超 杨希祥 +2 位作者 邓小龙 龙远 侯中喜 《国防科技大学学报》 北大核心 2025年第2期78-88,共11页
针对平流层浮空器在动态风场中的区域驻留问题,面向不同的控制通道,基于深度强化学习D3QN算法设计了环境风利用的浮空器区域驻留控制器,研究了不同的奖励函数对区域驻留控制器性能的影响。在以区域驻留时长为3 d、区域驻留半径为50 km... 针对平流层浮空器在动态风场中的区域驻留问题,面向不同的控制通道,基于深度强化学习D3QN算法设计了环境风利用的浮空器区域驻留控制器,研究了不同的奖励函数对区域驻留控制器性能的影响。在以区域驻留时长为3 d、区域驻留半径为50 km的任务约束下,进行了区域驻留控制仿真。结果表明:与采用DDQN方法设计的区域驻留控制器相比,采用D3QN方法设计的控制器的性能显著提高,仅依靠高度调节控制轨迹的情况下,平均区域驻留半径可以达到25.26 km、驻留有效时间比为96.25%,在水平方向辅助动力推进的情况下,平均区域驻留半径可显著减小、驻留有效时间比可显著提高。同时,验证了基于深度强化学习设计的区域驻留控制器具有较强的鲁棒性,可通过不同的奖励函数设计控制器,满足不同的区域驻留任务需求。 展开更多
关键词 平流层浮空器 区域驻留控制 D3QN 动力推进
在线阅读 下载PDF
基于深度强化学习的风场中浮空器驻留控制 被引量:2
2
作者 柏方超 杨希祥 +1 位作者 邓小龙 侯中喜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第7期2354-2366,共13页
建立了平流层浮空器区域驻留模型,在有动力和无动力推进的情况下,基于马尔可夫决策过程,将具有优先经验回放的双深度Q学习应用于平流层浮空器区域驻留控制。通过平均区域驻留半径、区域驻留有效时间比等参数来评价区域驻留控制方法的效... 建立了平流层浮空器区域驻留模型,在有动力和无动力推进的情况下,基于马尔可夫决策过程,将具有优先经验回放的双深度Q学习应用于平流层浮空器区域驻留控制。通过平均区域驻留半径、区域驻留有效时间比等参数来评价区域驻留控制方法的效果。典型风场中仿真分析结果指出:在区域驻留半径为50 km、区域驻留时间为3天的任务下,无动力推进的平流层浮空器的平均区域驻留半径为28.16 km,区域驻留有效时间比为83%;有动力推进平流层浮空器的平均区域驻留半径可达8.84 km,可实现区域驻留半径为20 km的飞行控制,区域驻留有效时间比为100%。 展开更多
关键词 平流层浮空器 动态风场 区域驻留控制 深度强化学习 动力推进
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部