-
题名XCSG在多机器人强化学习中的应用
被引量:2
- 1
-
-
作者
邵杰
杜丽娟
杨静宇
-
机构
郑州成功财经学院信息工程系
南京理工大学计算机科学与技术学院
商丘工学院信息与电子学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第8期249-251,292,共4页
-
基金
国家自然科学基金(90820004)资助
-
文摘
XCS分类器在解决机器人强化学习方面已显示出较强的能力,但在多机器人领域仅局限于MDP环境,只能解决环境空间较小的学习问题。提出了XCSG来解决多机器人的强化学习问题。XCSG建立低维的逼近函数,梯度下降技术利用在线知识建立稳定的逼近函数,使Q-表格一直保持在稳定低维状态。逼近函数Q不仅所需的存储空间更小,而且允许机器人在线对已获得的知识进行归纳一般化。仿真实验表明,XCSG算法很好地解决了多机器人学习空间大、学习速度慢、学习效果不确定等问题。
-
关键词
强化学习
多机器人
学习分类器
梯度下降法的学习分类器
-
Keywords
Reinforcement learning
Multi-robot
accuracy-based learning classifier system(xcs)
accuracy-based learning classifier system with gradient descent method(xcsG)
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名XCS及其在二进制序列分类问题中的应用
被引量:1
- 2
-
-
作者
李鑫
陶华敏
罗辉舞
吴东娅
-
机构
国防科学技术大学电子科学与工程学院
-
出处
《现代电子技术》
2014年第5期90-93,96,共5页
-
文摘
XCS作为一种基于精度的学习分类器系统,是近年来机器学习领域研究的热点。介绍了XCS的基本结构,研究了其在序列分类问题中的应用,并以此为基础构建一个学习/测试系统,实现了对二进制序列的学习和分类,讨论了相关参数对学习性能的影响,最后对XCS的应用前景进行了总结。
-
关键词
学习分类器系统
机器学习
二进制序列
-
Keywords
xcs
xcs
learning classifier system
machine learning,binary sequence
-
分类号
TN911.1
[电子电信—通信与信息系统]
-