期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于状态敏感度的移动机器人路径规划
1
作者 赵昀 陈庆伟 胡维礼 《南京理工大学学报》 EI CAS CSCD 北大核心 2012年第1期7-11,共5页
针对未知环境下的移动机器人系统,研究了使机器人能同时躲避静态和动态障碍物、且快速抵达目标的路径规划问题。首先通过定义一种新的状态敏感度测度,度量状态与目标之间的关联程度,指导机器人对环境的自主探索方向和力度,进而利用强化... 针对未知环境下的移动机器人系统,研究了使机器人能同时躲避静态和动态障碍物、且快速抵达目标的路径规划问题。首先通过定义一种新的状态敏感度测度,度量状态与目标之间的关联程度,指导机器人对环境的自主探索方向和力度,进而利用强化学习获得机器人的最优行动策略。通过引入状态敏感度测度,提高算法的学习速度、学习性能。最后通过对环境未知、且具有动态障碍物的路径规划任务的实例仿真,验证了所提方法的有效性。 展开更多
关键词 移动机器人 路径规划 强化学习 状态敏感度
在线阅读 下载PDF
求解多目标协调二级电压控制的简化强化学习方法 被引量:6
2
作者 李婷 刘明波 《中国电机工程学报》 EI CSCD 北大核心 2013年第31期130-139,16,共10页
以最小化分区内主导节点电压偏差和发电机无功出力比例的方差为目标,建立多目标协调二级电压控制模型,可协调变电站容抗器与发电机自动电压调节器的动作。针对其控制特点和在线优化的要求,提出一种简化强化学习求解方法。为了加快奖励... 以最小化分区内主导节点电压偏差和发电机无功出力比例的方差为目标,建立多目标协调二级电压控制模型,可协调变电站容抗器与发电机自动电压调节器的动作。针对其控制特点和在线优化的要求,提出一种简化强化学习求解方法。为了加快奖励值的传播速度,该方法定义了新的状态函数,并在主循环之前利用全局搜索来实现初始值定位和状态空间的自主压缩,从而极大地提高搜索效率;在主循环的搜索过程中采用基于状态敏感度的自适应学习阶段划分准则,实现学习经验搜索与利用的平衡;将单次动作的变量选择范围扩大到所有控制变量,使得在有限循环次数下的搜索尽可能覆盖到整个状态空间。为了反映系统的当前偏好信息,引入实时权重系数的概念,并在求得帕累托前沿后根据实时权重选出最优控制。算例分析分别从帕累托前沿质量、优化时间、收敛率以及实时权重的控制效果四个方面验证了简化强化学习方法和实时权重系数的优越性。 展开更多
关键词 多目标协调二级电压控制 强化学习 实时权重 帕累托前沿 状态敏感度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部