-
题名基于强化学习的空间机械臂控制方法
被引量:9
- 1
-
-
作者
李鹤宇
林廷宇
曾贲
施国强
-
机构
北京电子工程总体研究所
北京仿真中心
-
出处
《航天控制》
CSCD
北大核心
2020年第6期38-43,共6页
-
文摘
针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法。构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化学习算法的交互,通过奖励函数实现对神经网络参数的训练,最终实现使用近端策略优化算法(Proximal Policy Optimization,PPO)控制空间机械臂将抓手移动至物体下方特定位置的目的。实验结果表明,本文提出的控制算法能够快速收敛,实现控制空间机械臂完成特定目标,并且有效降低抖动现象,提升控制的稳定性。
-
关键词
空间机械臂
神经网络
深度强化学习
近端策略优化算法(PPO)
-
Keywords
Space manipulator
Neural network
Deep reinforcement learning
Proxinal Policy optimization algorithm(PPO)
-
分类号
TP241
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于深度强化学习的舰艇空中威胁行为建模
被引量:1
- 2
-
-
作者
房霄
曾贲
宋祥祥
贾正轩
-
机构
北京电子工程总体研究所
-
出处
《现代防御技术》
2020年第5期59-66,共8页
-
文摘
随着武器装备智能化发展的速度加快,传统武器装备的训练方法已经无法满足大规模现代战争的训练需求。在近十年中深度强化学习等人工智能方法在棋类以及电子竞技游戏中取得了极大突破,证明了人工智能方法在面对大搜索空间博弈问题的优势,能够有效解决军事对抗问题中的形势预判和临机调整问题。基于此背景,依托海军舰艇对空方面作战,开展了深度强化学习的方法研究。首先通过并行场景建模技术以及空中威胁决策行为建模技术实现深度学习模型的构建,之后通过单机突防场景的对抗迭代学习,得到收敛的突防策略。验证了深度强化学习方法在空中威胁行为构建场景的可行性,为后续深入开展编队联合防空训练场景构建提供支撑。
-
关键词
深度强化学习
人工智能
舰艇防空
空中威胁
突防策略
场景构建
-
Keywords
deep reinforcement learning
artificial intelligence(AI)
warship air defense
air threat
penetration strategy
modeling
-
分类号
U674.7
[交通运输工程—船舶及航道工程]
E917
[军事]
-