期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于强化学习的空间机械臂控制方法 被引量:9
1
作者 李鹤宇 林廷宇 +1 位作者 曾贲 施国强 《航天控制》 CSCD 北大核心 2020年第6期38-43,共6页
针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法。构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化学习算法的交互,通过奖励函数实现对神经网络参数的训练,最终... 针对现有空间机械臂控制方法在实际应用中调试时间长、稳定性差的问题,提出一种基于深度强化学习的控制算法。构建仿真环境用于产生数据,通过状态变量实现仿真环境与深度强化学习算法的交互,通过奖励函数实现对神经网络参数的训练,最终实现使用近端策略优化算法(Proximal Policy Optimization,PPO)控制空间机械臂将抓手移动至物体下方特定位置的目的。实验结果表明,本文提出的控制算法能够快速收敛,实现控制空间机械臂完成特定目标,并且有效降低抖动现象,提升控制的稳定性。 展开更多
关键词 空间机械臂 神经网络 深度强化学习 近端策略优化算法(PPO)
在线阅读 下载PDF
基于深度强化学习的舰艇空中威胁行为建模 被引量:1
2
作者 房霄 曾贲 +1 位作者 宋祥祥 贾正轩 《现代防御技术》 2020年第5期59-66,共8页
随着武器装备智能化发展的速度加快,传统武器装备的训练方法已经无法满足大规模现代战争的训练需求。在近十年中深度强化学习等人工智能方法在棋类以及电子竞技游戏中取得了极大突破,证明了人工智能方法在面对大搜索空间博弈问题的优势... 随着武器装备智能化发展的速度加快,传统武器装备的训练方法已经无法满足大规模现代战争的训练需求。在近十年中深度强化学习等人工智能方法在棋类以及电子竞技游戏中取得了极大突破,证明了人工智能方法在面对大搜索空间博弈问题的优势,能够有效解决军事对抗问题中的形势预判和临机调整问题。基于此背景,依托海军舰艇对空方面作战,开展了深度强化学习的方法研究。首先通过并行场景建模技术以及空中威胁决策行为建模技术实现深度学习模型的构建,之后通过单机突防场景的对抗迭代学习,得到收敛的突防策略。验证了深度强化学习方法在空中威胁行为构建场景的可行性,为后续深入开展编队联合防空训练场景构建提供支撑。 展开更多
关键词 深度强化学习 人工智能 舰艇防空 空中威胁 突防策略 场景构建
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部