期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于多智能体强化学习的履带机器人摆臂控制方法 被引量:1
1
作者 张洪川 任君凯 +2 位作者 潘海南 梅勇 卢惠民 《兵工自动化》 北大核心 2025年第2期92-95,共4页
为解决摆臂式履带机器人在3维环境下实现自主摆臂控制面临的挑战,提出一种基于多智能体强化学习的摆臂控制方法。将机器人的每个摆臂视为一个独立智能体,设计一套兼顾底盘稳定性和摆臂动作的奖励函数,采用多智能体强化学习训练各个摆臂... 为解决摆臂式履带机器人在3维环境下实现自主摆臂控制面临的挑战,提出一种基于多智能体强化学习的摆臂控制方法。将机器人的每个摆臂视为一个独立智能体,设计一套兼顾底盘稳定性和摆臂动作的奖励函数,采用多智能体强化学习训练各个摆臂运动;将所提方法部署在基于Isaac Sim搭建的3维仿真环境中,通过向每个智能体输入局部高程图和机器人状态,输出摆臂转角。实验结果表明:该方法能实现多种地形下的摆臂自主控制,在机器人自主越障方面相对于单智能体强化学习有显著提升。 展开更多
关键词 多智能体强化学习 履带机器人 自主越障 摆臂自主控制
在线阅读 下载PDF
基于深度强化学习的履带机器人摆臂控制方法
2
作者 潘海南 陈柏良 +4 位作者 黄开宏 任君凯 程创 卢惠民 张辉 《系统仿真学报》 CAS CSCD 北大核心 2024年第2期405-414,共10页
摆臂式履带机器人具有一定的地形适应能力,实现摆臂的自主控制对提升机器人在复杂环境中的智能化作业水平具有重要意义。结合专家越障知识和技术指标对机器人的摆臂控制问题进行马尔可夫决策过程(Markov decision process,MDP)建模,基... 摆臂式履带机器人具有一定的地形适应能力,实现摆臂的自主控制对提升机器人在复杂环境中的智能化作业水平具有重要意义。结合专家越障知识和技术指标对机器人的摆臂控制问题进行马尔可夫决策过程(Markov decision process,MDP)建模,基于物理仿真引擎Pymunk搭建了越障训练的仿真环境;提出一种基于D3QN(dueling double DQN)网络模型的深度强化学习摆臂控制算法,以地形信息与机器人状态为输入,以机器人前后四摆臂转角为输出,能够实现挑战性地形下履带机器人摆臂的自学习控制。在Gazebo三维仿真环境中将算法学得的控制策略与人工操纵进行了对比实验,结果表明:所提算法相对人工操纵具有更加高效的复杂地形通行能力。 展开更多
关键词 履带机器人 摆臂自主控制 自主越障 深度强化学习 机器人操作
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部