期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于半马氏博弈模型的分层强化学习研究 被引量:2
1
作者 李誌 胡坤 余雪丽 《计算机工程与设计》 CSCD 北大核心 2012年第9期3558-3562,共5页
针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,... 针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,更符合MAHRL研究的实际情况;协同框架中分别用SMG和SMDP模型对不同子任务进行建模,明确了Agent之间的协同机制。通过实验证明了SMG模型和协同框架的有效性和优越性。 展开更多
关键词 多AGENT强化学习 分层强化学习 部分感知 半马氏博弈模型 协同框架
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部