期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Stackelberg策略的多Agent强化学习警力巡逻路径规划 被引量:4
1
作者 解易 顾益军 《北京理工大学学报》 EI CAS CSCD 北大核心 2017年第1期93-99,共7页
为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时... 为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性,采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法,在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性. 展开更多
关键词 巡逻路线规划 Stackelberg强均衡策略 多AGENT 强化学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部