期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
面向Option的k-聚类Subgoal发现算法 被引量:8
1
作者 王本年 高阳 +2 位作者 陈兆乾 谢俊元 陈世福 《计算机研究与发展》 EI CSCD 北大核心 2006年第5期851-855,共5页
在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现... 在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现所有符合要求的Subgoal,与Q-学习和基于多样性密度的强化学习算法相比,用该算法发现Subgoal并创建Option的强化学习算法能有效提高A-gent的学习速度. 展开更多
关键词 分层强化学习 OPTION 子目标
在线阅读 下载PDF
动态未知环境中移动机器人的滚动路径规划及安全性分析 被引量:32
2
作者 张纯刚 席裕庚 《控制理论与应用》 EI CAS CSCD 北大核心 2003年第1期37-44,共8页
借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的机器人路径规划问题 .提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,以滚动方式进行在线规划 ,合理结合了优化与反馈 ,对... 借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的机器人路径规划问题 .提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,以滚动方式进行在线规划 ,合理结合了优化与反馈 ,对动态环境具有良好的适应性 . 展开更多
关键词 动态未知环境 移动机器人 滚动路径规划 安全性分析
在线阅读 下载PDF
利用机器人行为动力学与滚动窗口路径规划 被引量:9
3
作者 傅卫平 张鹏飞 杨世强 《计算机工程与应用》 CSCD 北大核心 2009年第2期212-215,236,共5页
针对存在静态障碍物的未知环境下移动机器人路径规划问题,提出运用行为动力学与滚动窗口相结合进行路径规划的方法。首先根据所获得的窗口(局部环境)信息,采用启发式函数进行局部子目标优化选择;然后将路径规划问题即导航行为分解为趋... 针对存在静态障碍物的未知环境下移动机器人路径规划问题,提出运用行为动力学与滚动窗口相结合进行路径规划的方法。首先根据所获得的窗口(局部环境)信息,采用启发式函数进行局部子目标优化选择;然后将路径规划问题即导航行为分解为趋于目标行为和避障行为,并对这两种行为分别建立了行为状态和行为模式动力学模型;在此基础上,以窗口为单位,利用导航行为动力学模型进行在线自主路径规划;将一系列窗口中的规划轨迹按照连续性条件首尾相接,最终完成了一条全局规划任务。该方法原理简单,计算量小,规划路径光滑,具有较强的实际应用价值。通过计算机实例仿真验证了该方法的有效性和适应性。 展开更多
关键词 移动机器人 滚动窗口 动力学模型 路径规划 子目标
在线阅读 下载PDF
基于路径匹配的在线分层强化学习方法 被引量:4
4
作者 石川 史忠植 王茂光 《计算机研究与发展》 EI CSCD 北大核心 2008年第9期1470-1476,共7页
如何在线找到正确的子目标是基于option的分层强化学习的关键问题.通过分析学习主体在子目标处的动作,发现了子目标的有效动作受限的特性,进而将寻找子目标的问题转化为寻找路径中最匹配的动作受限状态.针对网格学习环境,提出了单向值... 如何在线找到正确的子目标是基于option的分层强化学习的关键问题.通过分析学习主体在子目标处的动作,发现了子目标的有效动作受限的特性,进而将寻找子目标的问题转化为寻找路径中最匹配的动作受限状态.针对网格学习环境,提出了单向值方法表示子目标的有效动作受限特性和基于此方法的option自动发现算法.实验表明,基于单向值方法产生的option能够显著加快Q学习算法,也进一步分析了option产生的时机和大小对Q学习算法性能的影响. 展开更多
关键词 强化学习 分层强化学习 OPTION 子目标 路径匹配
在线阅读 下载PDF
一种克服振荡与死循环的机器人实时路径规划方法(英文) 被引量:8
5
作者 张纯刚 席裕庚 《自动化学报》 EI CSCD 北大核心 2003年第2期197-205,共9页
本文研究了一般障碍环境下全局信息未知的机器人路径规划问题 ,分析了基于实时探测信息的滚动路径规划算法可能遇到的振荡和死循环现象 ,提出了增加适量记忆的改进滚动路径规划算法 ,不仅有效地克服了振荡和死循环的发生 ,而且保证了机... 本文研究了一般障碍环境下全局信息未知的机器人路径规划问题 ,分析了基于实时探测信息的滚动路径规划算法可能遇到的振荡和死循环现象 ,提出了增加适量记忆的改进滚动路径规划算法 ,不仅有效地克服了振荡和死循环的发生 ,而且保证了机器人对全局目标的可达性 ,为移动机器人在一般未知障碍环境下的路径规划提供了快速。 展开更多
关键词 机器人 实时路径规划 滚动规则 局部规划 振荡 死循环 可达性
在线阅读 下载PDF
智能规划中的可纳子目标排序 被引量:2
6
作者 梁瑞仕 姜云飞 +1 位作者 边芮 吴向军 《软件学报》 EI CSCD 北大核心 2011年第5期914-928,共15页
提出了一种称为可纳子目标排序(admissible subgoal ordering,简称ASO)的排序关系,给出了可纳排序的形式化定义并讨论其对增量式规划的重要性.随后介绍了原子依赖关系理论和原子依赖图技术,能够在多项式时间内近似求解可纳子目标排序关... 提出了一种称为可纳子目标排序(admissible subgoal ordering,简称ASO)的排序关系,给出了可纳排序的形式化定义并讨论其对增量式规划的重要性.随后介绍了原子依赖关系理论和原子依赖图技术,能够在多项式时间内近似求解可纳子目标排序关系.最后给出了一种计算可纳子目标序列的算法.其所有思想已经在规划系统ASOP中实现.通过在国际规划大赛标准测试领域问题上的实验,其结果表明,该方法能够有效地求解大规模的规划问题,并能极大地改善规划性能. 展开更多
关键词 智能规划 子目标排序 可纳排序关系 增量式规划 原子依赖图技术
在线阅读 下载PDF
基于滚动窗口的移动机器人路径规划 被引量:14
7
作者 张纯刚 《系统工程与电子技术》 EI CSCD 北大核心 2002年第6期63-65,69,共4页
借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的移动机器人路径规划问题。提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,并通过有效的场景预测 ,以滚动方式进行在线规划 ... 借鉴预测控制滚动优化原理 ,研究了全局环境未知且存在动态障碍物情况下的移动机器人路径规划问题。提出的基于滚动窗口的移动机器人路径规划方法充分利用机器人实时测得的局部环境信息 ,并通过有效的场景预测 ,以滚动方式进行在线规划 ,结合了优化和反馈机制 ,具有计算量小、反应迅速的特点。大量仿真结果表明 ,该方法能很好地适应动态不确定环境。 展开更多
关键词 机器人路径规划 滚动规划 预测控制 子目标
在线阅读 下载PDF
基于禁忌搜索的option自动构造
8
作者 徐明亮 苏晓萍 须文波 《系统仿真学报》 CAS CSCD 北大核心 2009年第23期7479-7482,共4页
通过在环境中设置禁忌状态,agent能够在与环境的交互过程中发现瓶颈状态,以及瓶颈状态之间的毗邻关系。agent根据瓶颈状态之间的毗邻关系,自动地从毗邻的瓶颈状态中挑选合适的瓶颈状态作为option子目标。同时在交互过程中获得Option的... 通过在环境中设置禁忌状态,agent能够在与环境的交互过程中发现瓶颈状态,以及瓶颈状态之间的毗邻关系。agent根据瓶颈状态之间的毗邻关系,自动地从毗邻的瓶颈状态中挑选合适的瓶颈状态作为option子目标。同时在交互过程中获得Option的初始集,实现option的自动构造。网格环境中的导航实验验证了该方法无需人工干预就可以自动构造有用的option,即可以加快agent学习速度,也便于知识迁移,加快相关任务的学习。 展开更多
关键词 分层强化学习 OPTION 子目标 禁忌搜索 Q-LEARNING
在线阅读 下载PDF
基于实时滚动亚目标的遥控移动机器人局部路径规划方法
9
作者 章小兵 宋爱国 唐鸿儒 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期58-62,共5页
在机器人前部一定范围内虚拟出8个亚目标,采集前部8个超声波传感器数据,根据工作场所障碍物分布情况,分析指定范围内有无障碍物,结合机器人航向偏离目标的角度,选择最佳亚目标.若机器人航向在一个规定的小角度范围内对准目标且机器人正... 在机器人前部一定范围内虚拟出8个亚目标,采集前部8个超声波传感器数据,根据工作场所障碍物分布情况,分析指定范围内有无障碍物,结合机器人航向偏离目标的角度,选择最佳亚目标.若机器人航向在一个规定的小角度范围内对准目标且机器人正前方无障碍物,机器人作直线运动;其他情况下,机器人以圆弧接近最佳亚目标.在运动过程中,最佳亚目标滚动更新,运动轨迹随之变化.该方法克服了机器人避障时速度慢的缺点,避障流畅,路径平滑且能以较短路径接近目标,实用快捷. 展开更多
关键词 遥控移动机器人 局部路径规划 实时滚动亚目标
在线阅读 下载PDF
New coordination scheme for multi-robot systems based on state space models
10
作者 Xie Wenlong Su Jianbo Lin Zongli 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第4期722-734,共13页
A new coordination scheme for multi-robot systems is proposed. A state space model of the multi- robot system is defined and constructed in which the system's initial and goal states are included along with the task ... A new coordination scheme for multi-robot systems is proposed. A state space model of the multi- robot system is defined and constructed in which the system's initial and goal states are included along with the task definition and the system's internal and external constraints. Task accomplishment is considered a transition of the system state in its state space (SS) under the system's constraints. Therefore, if there exists a connectable path within reachable area of the SS from the initial state to the goal state, the task is realizable. The optimal strategy for the task realization under constraints is investigated and reached by searching for the optimal state transition trajectory of the robot system in the SS. Moreover, if there is no connectable path, which means the task cannot be performed Successfully, the task could be transformed to be realizable by making the initial state and the goal state connectable and finding a path connecting them in the system's SS. This might be done via adjusting the system's configuration and/or task constraints. Experiments of multi-robot formation control with obstacles in the environment are conducted and simulation results show the validity of the proposed method. 展开更多
关键词 multi-robot system COORDINATION state space formation maneuver subgoal
在线阅读 下载PDF
用于分层强化学习的最小k-聚类算法
11
作者 王本年 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第5期533-535,共3页
在学习过程中自动发现有用的Subgoal,对于分层强化学习有着重要的意义。文章提出了一种最小k-聚类算法,该算法能通过对在线获取的少量路径数据进行聚类的方法,抽取出有用的Subgoal;实验表明,该算法能有效地发现所有符合要求的Subgoal,... 在学习过程中自动发现有用的Subgoal,对于分层强化学习有着重要的意义。文章提出了一种最小k-聚类算法,该算法能通过对在线获取的少量路径数据进行聚类的方法,抽取出有用的Subgoal;实验表明,该算法能有效地发现所有符合要求的Subgoal,较多样性密度算法和FD算法有更强的Subgoal发现能力。 展开更多
关键词 k-聚类算法 分层强化学习 子目标
在线阅读 下载PDF
分析逻辑程序的一种有效工具——推导格式
12
作者 陈火炎 《暨南大学学报(自然科学与医学版)》 CAS CSCD 1990年第1期20-27,共8页
本文提出逻辑程序阿部推理机制的一种格式化描述方法——推导格式。这种描述方法是分析逻辑程序的一种有效的工具,它可帮助我们理解和调试给定的逻辑程序。
关键词 逻辑程序 推导格式 回溯
在线阅读 下载PDF
机器人在线路径规划改进算法 被引量:3
13
作者 隋玲玲 陈雄 《计算机工程与应用》 CSCD 北大核心 2010年第28期36-39,共4页
未知环境下机器人路径规划要求实时有效,针对传统动态窗口滚动优化算法易出现局部最小、震荡等问题,重新设计了子目标映射法则,并对局部路径规划算法引入对角线距离作为代价函数中的启发式部分,最后引入了禁忌搜索和多样化随机路径选择... 未知环境下机器人路径规划要求实时有效,针对传统动态窗口滚动优化算法易出现局部最小、震荡等问题,重新设计了子目标映射法则,并对局部路径规划算法引入对角线距离作为代价函数中的启发式部分,最后引入了禁忌搜索和多样化随机路径选择模块,克服了局部最小和震荡等问题,仿真实验证明了该算法可靠有效。 展开更多
关键词 滚动窗口 子目标映射 A*搜索算法 对角线距离 禁忌搜索 多样化选择
在线阅读 下载PDF
基于内在奖励的技能获取和组合方法
14
作者 赵英 秦进 《计算机应用研究》 CSCD 北大核心 2022年第12期3678-3682,3687,共6页
现有的内在奖励随着agent不断探索环境而逐渐消失,导致了agent无法利用内在奖励信号去指引agent寻找最优策略。为了解决这个问题,提出了一种基于内在奖励的技能获取和组合方法。该方法首先在agent与环境交互过程中寻找积极状态,在积极... 现有的内在奖励随着agent不断探索环境而逐渐消失,导致了agent无法利用内在奖励信号去指引agent寻找最优策略。为了解决这个问题,提出了一种基于内在奖励的技能获取和组合方法。该方法首先在agent与环境交互过程中寻找积极状态,在积极状态中筛选子目标;其次从初始状态到达子目标,子目标到达终止状态所产生的一条轨迹中发现技能,对技能中出现一个或者两个以上的子目标进行组合;最后用初始状态到子目标的距离和初始状态到子目标的累积奖励值对技能进行评估。该方法在Mujoco环境中取得了较高的平均奖励值,尤其是在外在奖励延迟的情况下,也能取得较好的平均奖励值。说明该方法提出的子目标和技能可以有效地解决内在奖励消失后,agent无法利用内在奖励信号学习最优策略的问题。 展开更多
关键词 积极状态 子目标 技能 技能评估
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部