期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种面向空间非合作目标的强化学习多臂协同俘获策略研究
被引量:
1
1
作者
张柄汉
王琛
+2 位作者
彭兆涛
张夷斋
张帆
《宇航学报》
EI
CAS
CSCD
北大核心
2023年第12期1934-1943,共10页
针对空间非合作目标清除任务中的目标适应性以及俘获动作规划复杂性等问题,提出了一种基于强化学习方法并结合“多臂分组协同”机制的包络俘获策略。首先构建了多臂俘获机构的物理模型和运动学模型,之后利用SAC(soft actor-critic)算法...
针对空间非合作目标清除任务中的目标适应性以及俘获动作规划复杂性等问题,提出了一种基于强化学习方法并结合“多臂分组协同”机制的包络俘获策略。首先构建了多臂俘获机构的物理模型和运动学模型,之后利用SAC(soft actor-critic)算法并引入前演训练(PT)设计了强化学习控制器,接着基于“多臂分组协同”奖励机制设计奖励函数以训练得到最优俘获动作。为了验证俘获策略对单目标作业的高效性和对多目标作业的高适应性,对各种目标分别进行仿真实验。仿真结果表明:所得的俘获策略可以对多种构型的目标实现高效、高适应地俘获。
展开更多
关键词
空间非合作目标
空间
俘获
策略
强化学习
包络俘获
多臂协同
在线阅读
下载PDF
职称材料
题名
一种面向空间非合作目标的强化学习多臂协同俘获策略研究
被引量:
1
1
作者
张柄汉
王琛
彭兆涛
张夷斋
张帆
机构
长安大学工程机械学院
西北工业大学航天学院
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2023年第12期1934-1943,共10页
基金
国家自然科学基金(62173275,62222313)。
文摘
针对空间非合作目标清除任务中的目标适应性以及俘获动作规划复杂性等问题,提出了一种基于强化学习方法并结合“多臂分组协同”机制的包络俘获策略。首先构建了多臂俘获机构的物理模型和运动学模型,之后利用SAC(soft actor-critic)算法并引入前演训练(PT)设计了强化学习控制器,接着基于“多臂分组协同”奖励机制设计奖励函数以训练得到最优俘获动作。为了验证俘获策略对单目标作业的高效性和对多目标作业的高适应性,对各种目标分别进行仿真实验。仿真结果表明:所得的俘获策略可以对多种构型的目标实现高效、高适应地俘获。
关键词
空间非合作目标
空间
俘获
策略
强化学习
包络俘获
多臂协同
Keywords
Space non-cooperation targets
Space capture strategy
Reinforcement learning
Envelope capture
Multi-arm synergy mechanism
分类号
TP241 [自动化与计算机技术—检测技术与自动化装置]
V443 [航空宇航科学与技术—飞行器设计]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种面向空间非合作目标的强化学习多臂协同俘获策略研究
张柄汉
王琛
彭兆涛
张夷斋
张帆
《宇航学报》
EI
CAS
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部