期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Stackelberg策略的多Agent强化学习警力巡逻路径规划
被引量:
4
1
作者
解易
顾益军
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2017年第1期93-99,共7页
为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时...
为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性,采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法,在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性.
展开更多
关键词
巡逻路线规划
Stackelberg强均衡策略
多AGENT
强化学习
在线阅读
下载PDF
职称材料
题名
基于Stackelberg策略的多Agent强化学习警力巡逻路径规划
被引量:
4
1
作者
解易
顾益军
机构
中国人民公安大学网络安全保卫学院
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2017年第1期93-99,共7页
基金
中国人民公安大学基本科研业务费项目(2014JKF01132)
文摘
为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性,采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法,在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性.
关键词
巡逻路线规划
Stackelberg强均衡策略
多AGENT
强化学习
Keywords
patrol path planning
strong Stackelberg equilibrium
multiagent
reinforcement learning
分类号
TP399 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Stackelberg策略的多Agent强化学习警力巡逻路径规划
解易
顾益军
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2017
4
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部