期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于模糊神经网络局部强化学习在Robocup中的应用 被引量:4
1
作者 吴定会 李真 纪志成 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第16期3719-3723,共5页
针对Robocup仿真组比赛中智能体的配合与动作选取,将模糊神经网络(FNN)和局部协调图动态角色分配与传统Q-学习相结合,提出了基于模糊神经网络的局部Q-学习。采用该方法,有效抑制了仿真平台中的噪声干扰,提高了动作选取的精度,解决了传... 针对Robocup仿真组比赛中智能体的配合与动作选取,将模糊神经网络(FNN)和局部协调图动态角色分配与传统Q-学习相结合,提出了基于模糊神经网络的局部Q-学习。采用该方法,有效抑制了仿真平台中的噪声干扰,提高了动作选取的精度,解决了传统Q-学习中Q表占用内存空间过大的问题,增强了系统的泛化能力,并进一步缩短了学习时间,更好的满足比赛实时性的要求。将其运用于仿真组比赛的传球和射门模型中,验证了该方法的有效性。 展开更多
关键词 robocup仿真 角色分配 强化学习 模糊神经网络
在线阅读 下载PDF
基于CMAC网络Sarsa(λ)学习的RoboCup守门员策略
2
作者 刘云龙 吉国力 《北京工业大学学报》 EI CAS CSCD 北大核心 2012年第9期1348-1352,共5页
针对RoboCup仿真组足球比赛场上状态复杂多变、同时供决策的信息大多为连续变量、智能体利用现有信息通常无法判断当前状态下最优动作的问题,以守门员为例,首先利用CMAC神经网络对连续状态空间泛化,然后在泛化后的状态上,采用Sarsa(λ)... 针对RoboCup仿真组足球比赛场上状态复杂多变、同时供决策的信息大多为连续变量、智能体利用现有信息通常无法判断当前状态下最优动作的问题,以守门员为例,首先利用CMAC神经网络对连续状态空间泛化,然后在泛化后的状态上,采用Sarsa(λ)学习算法获取守门员的最优策略.通过在RoboCup仿真平台上进行仿真,实验结果表明,采用基于CMAC的Sarsa(λ)学习算法的守门员,经过一定时间的学习后,防守时间显著增长,防守效果明显优于其他算法,验证了本文所提方案的有效性. 展开更多
关键词 robocup仿真组足球比赛 CMAC神经网络 泛化 Sarsa(λ)学习算法 最优策略
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部