期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于半马氏博弈模型的分层强化学习研究
被引量:
2
1
作者
李誌
胡坤
余雪丽
《计算机工程与设计》
CSCD
北大核心
2012年第9期3558-3562,共5页
针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,...
针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,更符合MAHRL研究的实际情况;协同框架中分别用SMG和SMDP模型对不同子任务进行建模,明确了Agent之间的协同机制。通过实验证明了SMG模型和协同框架的有效性和优越性。
展开更多
关键词
多AGENT强化学习
分层强化学习
部分感知
半马氏博弈模型
协同框架
在线阅读
下载PDF
职称材料
题名
基于半马氏博弈模型的分层强化学习研究
被引量:
2
1
作者
李誌
胡坤
余雪丽
机构
太原理工大学计算机科学与技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2012年第9期3558-3562,共5页
基金
国家自然科学基金项目(60873139)
山西省自然科学基金项目(2008011040)
虚拟技术与系统国家重点实验室基金项目(SKVR-KF-09-04)
文摘
针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,更符合MAHRL研究的实际情况;协同框架中分别用SMG和SMDP模型对不同子任务进行建模,明确了Agent之间的协同机制。通过实验证明了SMG模型和协同框架的有效性和优越性。
关键词
多AGENT强化学习
分层强化学习
部分感知
半马氏博弈模型
协同框架
Keywords
multi-Agent reinforcement learning
hierarchical reinforcement learning
partial perception
semi-markov game
cooperative framework
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于半马氏博弈模型的分层强化学习研究
李誌
胡坤
余雪丽
《计算机工程与设计》
CSCD
北大核心
2012
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部