期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
关系强化学习方法的初步研究
被引量:
1
1
作者
刘全
周文云
李志涛
《计算机应用与软件》
CSCD
2010年第2期40-43,共4页
强化学习方法是人工智能领域中比较重要的方法之一,自从其提出以来已经有了很大的发展,并且能用来解决很多的问题。但是在遇到大规模状态空间问题时,使用普通的强化学习方法就会产生"维数灾"现象,所以提出了关系强化学习,把...
强化学习方法是人工智能领域中比较重要的方法之一,自从其提出以来已经有了很大的发展,并且能用来解决很多的问题。但是在遇到大规模状态空间问题时,使用普通的强化学习方法就会产生"维数灾"现象,所以提出了关系强化学习,把强化学习应用到关系领域可以在一定的程度上解决"维数灾"难题。在此基础上,简单介绍关系强化学习的概念以及相关的算法,以及以后有待解决的问题。
展开更多
关键词
强化
学习
维数灾
关系强化学习
在线阅读
下载PDF
职称材料
题名
关系强化学习方法的初步研究
被引量:
1
1
作者
刘全
周文云
李志涛
机构
江苏省现代企业信息化应用支撑软件工程技术研究开发中心
苏州职业大学
苏州大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
2010年第2期40-43,共4页
基金
国家自然科学基金项目(60673092
60775046
+3 种基金
60873116)
教育部科学技术研究重点项目(207040)
中国博士后科研基金(20060390919)
江苏省高校自然科学基金(06KJB520104)
文摘
强化学习方法是人工智能领域中比较重要的方法之一,自从其提出以来已经有了很大的发展,并且能用来解决很多的问题。但是在遇到大规模状态空间问题时,使用普通的强化学习方法就会产生"维数灾"现象,所以提出了关系强化学习,把强化学习应用到关系领域可以在一定的程度上解决"维数灾"难题。在此基础上,简单介绍关系强化学习的概念以及相关的算法,以及以后有待解决的问题。
关键词
强化
学习
维数灾
关系强化学习
Keywords
Reinforcement learning Curse of dimensionality Relational reinforce learning
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
O343.2 [理学—固体力学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
关系强化学习方法的初步研究
刘全
周文云
李志涛
《计算机应用与软件》
CSCD
2010
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部