-
题名群体追逃微分博弈
- 1
-
-
作者
高红伟
孟斌斌
刘剑
戴照鹏
-
机构
青岛大学数学与统计学院
军事科学院国防科技创新研究院智能博弈与决策实验室
海军潜艇学院
-
出处
《运筹学学报(中英文)》
CSCD
北大核心
2024年第3期46-62,共17页
-
基金
国家自然科学基金(No.72171126)。
-
文摘
本文以微分博弈和经典的追逃问题为主线,对群体追逃微分博弈的历史发展脉络进行梳理。针对大规模群体追逃问题,从平均场博弈视角出发,阐释了强化学习技术的应用前景。提出探索解决逆向追逃微分博弈的观点,可适用于水下无人舰艇、陆地机器人以及空中无人机集群等同类场景。区别于其他综述性文章,作者对于俄罗斯以及苏联在本领域发展历史中代表性的学术流派给予了较多关注。
-
关键词
追逃微分博弈
群体智能博弈
平均场博弈
逆向博弈
强化学习
-
Keywords
pursuit-evasion differential games
swarm intelligence games
mean-field games
inverse game theory
reinforcement learning
-
分类号
O225
[理学—运筹学与控制论]
-
-
题名基于分布式AC强化学习的集群任务分配
- 2
-
-
作者
杨绍卿
左源
邓宝松
-
机构
军事科学院国防科技创新研究院
-
出处
《火力与指挥控制》
北大核心
2025年第5期77-83,90,共8页
-
基金
军队装备综合研究基金资助项目。
-
文摘
针对异构无人集群作战过程中的任务分配问题,提出一种基于分布式演员-评论家(actor-critic)强化学习网络的任务分配方法。设计由transformer与Deep LSTM网络构成的编码模块对输入态势进行预处理编码;采用LSTM作为动作模块,并使用网络级联方式实现复杂动作解耦,对异构作战单元实现动态任务指派;使用线性感知机组成评价模块输出状态价值。仿真实验表明,提出的方法能够有效地实现异构无人集群的作战任务分配,具备良好的实用性与适用性。
-
关键词
任务分配
无人集群
强化学习
推演仿真
-
Keywords
task allocation
unmanned cluster
reinforcement learning
deduction simulation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-