期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
环境风利用的浮空器区域驻留深度强化学习控制方法
1
作者
柏方超
杨希祥
+2 位作者
邓小龙
龙远
侯中喜
《国防科技大学学报》
北大核心
2025年第2期78-88,共11页
针对平流层浮空器在动态风场中的区域驻留问题,面向不同的控制通道,基于深度强化学习D3QN算法设计了环境风利用的浮空器区域驻留控制器,研究了不同的奖励函数对区域驻留控制器性能的影响。在以区域驻留时长为3 d、区域驻留半径为50 km...
针对平流层浮空器在动态风场中的区域驻留问题,面向不同的控制通道,基于深度强化学习D3QN算法设计了环境风利用的浮空器区域驻留控制器,研究了不同的奖励函数对区域驻留控制器性能的影响。在以区域驻留时长为3 d、区域驻留半径为50 km的任务约束下,进行了区域驻留控制仿真。结果表明:与采用DDQN方法设计的区域驻留控制器相比,采用D3QN方法设计的控制器的性能显著提高,仅依靠高度调节控制轨迹的情况下,平均区域驻留半径可以达到25.26 km、驻留有效时间比为96.25%,在水平方向辅助动力推进的情况下,平均区域驻留半径可显著减小、驻留有效时间比可显著提高。同时,验证了基于深度强化学习设计的区域驻留控制器具有较强的鲁棒性,可通过不同的奖励函数设计控制器,满足不同的区域驻留任务需求。
展开更多
关键词
平流层浮空器
区域驻留控制
D3QN
动力推进
在线阅读
下载PDF
职称材料
基于深度强化学习的风场中浮空器驻留控制
被引量:
2
2
作者
柏方超
杨希祥
+1 位作者
邓小龙
侯中喜
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2024年第7期2354-2366,共13页
建立了平流层浮空器区域驻留模型,在有动力和无动力推进的情况下,基于马尔可夫决策过程,将具有优先经验回放的双深度Q学习应用于平流层浮空器区域驻留控制。通过平均区域驻留半径、区域驻留有效时间比等参数来评价区域驻留控制方法的效...
建立了平流层浮空器区域驻留模型,在有动力和无动力推进的情况下,基于马尔可夫决策过程,将具有优先经验回放的双深度Q学习应用于平流层浮空器区域驻留控制。通过平均区域驻留半径、区域驻留有效时间比等参数来评价区域驻留控制方法的效果。典型风场中仿真分析结果指出:在区域驻留半径为50 km、区域驻留时间为3天的任务下,无动力推进的平流层浮空器的平均区域驻留半径为28.16 km,区域驻留有效时间比为83%;有动力推进平流层浮空器的平均区域驻留半径可达8.84 km,可实现区域驻留半径为20 km的飞行控制,区域驻留有效时间比为100%。
展开更多
关键词
平流层浮空器
动态风场
区域驻留控制
深度强化学习
动力推进
在线阅读
下载PDF
职称材料
题名
环境风利用的浮空器区域驻留深度强化学习控制方法
1
作者
柏方超
杨希祥
邓小龙
龙远
侯中喜
机构
国防科技大学空天科学学院
出处
《国防科技大学学报》
北大核心
2025年第2期78-88,共11页
基金
国家自然科学基金资助项目(61903369,52272445)
湖南省杰出青年基金资助项目(2023JJ10056)。
文摘
针对平流层浮空器在动态风场中的区域驻留问题,面向不同的控制通道,基于深度强化学习D3QN算法设计了环境风利用的浮空器区域驻留控制器,研究了不同的奖励函数对区域驻留控制器性能的影响。在以区域驻留时长为3 d、区域驻留半径为50 km的任务约束下,进行了区域驻留控制仿真。结果表明:与采用DDQN方法设计的区域驻留控制器相比,采用D3QN方法设计的控制器的性能显著提高,仅依靠高度调节控制轨迹的情况下,平均区域驻留半径可以达到25.26 km、驻留有效时间比为96.25%,在水平方向辅助动力推进的情况下,平均区域驻留半径可显著减小、驻留有效时间比可显著提高。同时,验证了基于深度强化学习设计的区域驻留控制器具有较强的鲁棒性,可通过不同的奖励函数设计控制器,满足不同的区域驻留任务需求。
关键词
平流层浮空器
区域驻留控制
D3QN
动力推进
Keywords
stratospheric aerostat
station keeping control
D3QN
power propulsion
分类号
V274 [航空宇航科学与技术—飞行器设计]
在线阅读
下载PDF
职称材料
题名
基于深度强化学习的风场中浮空器驻留控制
被引量:
2
2
作者
柏方超
杨希祥
邓小龙
侯中喜
机构
国防科技大学空天科学学院
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2024年第7期2354-2366,共13页
基金
国家自然科学基金(61903369,52272445)
湖南省自然科学基金(2023JJ10056)。
文摘
建立了平流层浮空器区域驻留模型,在有动力和无动力推进的情况下,基于马尔可夫决策过程,将具有优先经验回放的双深度Q学习应用于平流层浮空器区域驻留控制。通过平均区域驻留半径、区域驻留有效时间比等参数来评价区域驻留控制方法的效果。典型风场中仿真分析结果指出:在区域驻留半径为50 km、区域驻留时间为3天的任务下,无动力推进的平流层浮空器的平均区域驻留半径为28.16 km,区域驻留有效时间比为83%;有动力推进平流层浮空器的平均区域驻留半径可达8.84 km,可实现区域驻留半径为20 km的飞行控制,区域驻留有效时间比为100%。
关键词
平流层浮空器
动态风场
区域驻留控制
深度强化学习
动力推进
Keywords
stratospheric aerostat
dynamic wind field
station keeping control
reinforcement learning
power propulsion
分类号
V274 [航空宇航科学与技术—飞行器设计]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
环境风利用的浮空器区域驻留深度强化学习控制方法
柏方超
杨希祥
邓小龙
龙远
侯中喜
《国防科技大学学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于深度强化学习的风场中浮空器驻留控制
柏方超
杨希祥
邓小龙
侯中喜
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部