期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于模糊神经网络局部强化学习在Robocup中的应用
被引量:
4
1
作者
吴定会
李真
纪志成
《系统仿真学报》
EI
CAS
CSCD
北大核心
2007年第16期3719-3723,共5页
针对Robocup仿真组比赛中智能体的配合与动作选取,将模糊神经网络(FNN)和局部协调图动态角色分配与传统Q-学习相结合,提出了基于模糊神经网络的局部Q-学习。采用该方法,有效抑制了仿真平台中的噪声干扰,提高了动作选取的精度,解决了传...
针对Robocup仿真组比赛中智能体的配合与动作选取,将模糊神经网络(FNN)和局部协调图动态角色分配与传统Q-学习相结合,提出了基于模糊神经网络的局部Q-学习。采用该方法,有效抑制了仿真平台中的噪声干扰,提高了动作选取的精度,解决了传统Q-学习中Q表占用内存空间过大的问题,增强了系统的泛化能力,并进一步缩短了学习时间,更好的满足比赛实时性的要求。将其运用于仿真组比赛的传球和射门模型中,验证了该方法的有效性。
展开更多
关键词
robocup
仿真
组
角色分配
强化学习
模糊神经网络
在线阅读
下载PDF
职称材料
基于CMAC网络Sarsa(λ)学习的RoboCup守门员策略
2
作者
刘云龙
吉国力
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2012年第9期1348-1352,共5页
针对RoboCup仿真组足球比赛场上状态复杂多变、同时供决策的信息大多为连续变量、智能体利用现有信息通常无法判断当前状态下最优动作的问题,以守门员为例,首先利用CMAC神经网络对连续状态空间泛化,然后在泛化后的状态上,采用Sarsa(λ)...
针对RoboCup仿真组足球比赛场上状态复杂多变、同时供决策的信息大多为连续变量、智能体利用现有信息通常无法判断当前状态下最优动作的问题,以守门员为例,首先利用CMAC神经网络对连续状态空间泛化,然后在泛化后的状态上,采用Sarsa(λ)学习算法获取守门员的最优策略.通过在RoboCup仿真平台上进行仿真,实验结果表明,采用基于CMAC的Sarsa(λ)学习算法的守门员,经过一定时间的学习后,防守时间显著增长,防守效果明显优于其他算法,验证了本文所提方案的有效性.
展开更多
关键词
robocup仿真组足球比赛
CMAC神经网络
泛化
Sarsa(λ)学习算法
最优策略
在线阅读
下载PDF
职称材料
题名
基于模糊神经网络局部强化学习在Robocup中的应用
被引量:
4
1
作者
吴定会
李真
纪志成
机构
江南大学电气自动化研究所
出处
《系统仿真学报》
EI
CAS
CSCD
北大核心
2007年第16期3719-3723,共5页
基金
江苏省高技术研究计划项目(BG2005014)
文摘
针对Robocup仿真组比赛中智能体的配合与动作选取,将模糊神经网络(FNN)和局部协调图动态角色分配与传统Q-学习相结合,提出了基于模糊神经网络的局部Q-学习。采用该方法,有效抑制了仿真平台中的噪声干扰,提高了动作选取的精度,解决了传统Q-学习中Q表占用内存空间过大的问题,增强了系统的泛化能力,并进一步缩短了学习时间,更好的满足比赛实时性的要求。将其运用于仿真组比赛的传球和射门模型中,验证了该方法的有效性。
关键词
robocup
仿真
组
角色分配
强化学习
模糊神经网络
Keywords
robocup
simulation team
role assignment
reinforcement learning
fuzzy neural network
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
基于CMAC网络Sarsa(λ)学习的RoboCup守门员策略
2
作者
刘云龙
吉国力
机构
厦门大学自动化系
出处
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2012年第9期1348-1352,共5页
基金
福建省自然科学基金资助项目(2010J05140)
高等学校博士学科点专项科研基金资助项目(20100121120022)
文摘
针对RoboCup仿真组足球比赛场上状态复杂多变、同时供决策的信息大多为连续变量、智能体利用现有信息通常无法判断当前状态下最优动作的问题,以守门员为例,首先利用CMAC神经网络对连续状态空间泛化,然后在泛化后的状态上,采用Sarsa(λ)学习算法获取守门员的最优策略.通过在RoboCup仿真平台上进行仿真,实验结果表明,采用基于CMAC的Sarsa(λ)学习算法的守门员,经过一定时间的学习后,防守时间显著增长,防守效果明显优于其他算法,验证了本文所提方案的有效性.
关键词
robocup仿真组足球比赛
CMAC神经网络
泛化
Sarsa(λ)学习算法
最优策略
Keywords
robocup
simulated soccer
CMAC neural networks
generalization
Sarsa (λ) learningalgorithm
optimal policy
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于模糊神经网络局部强化学习在Robocup中的应用
吴定会
李真
纪志成
《系统仿真学报》
EI
CAS
CSCD
北大核心
2007
4
在线阅读
下载PDF
职称材料
2
基于CMAC网络Sarsa(λ)学习的RoboCup守门员策略
刘云龙
吉国力
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2012
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部