期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向多网联无人机的MADRL协同路径规划算法
1
作者
李安
余传鑫
陈成
《西安电子科技大学学报》
北大核心
2025年第3期163-175,共13页
针对多架网联无人机执行多个动态目标点巡航监测任务的协同路径规划问题,文中提出了一种基于多智能体深度强化学习的协同动态目标分配与路径规划算法。具体而言,首先对多架CUAV对地通信系统环境建模,在CUAV与蜂窝网络通信连接约束、防...
针对多架网联无人机执行多个动态目标点巡航监测任务的协同路径规划问题,文中提出了一种基于多智能体深度强化学习的协同动态目标分配与路径规划算法。具体而言,首先对多架CUAV对地通信系统环境建模,在CUAV与蜂窝网络通信连接约束、防碰撞等移动性约束下,构建多架CUAV任务完成总时间和总中断时间加权和最小化优化问题。然后把优化问题离散化并转为马尔可夫博弈。为解决所构建的组合优化问题,提出了基于深度确定性策略梯度的系列算法,有效地处理CUAV之间的合作与竞争关系,且引入一个共享经验池,以提高算法的稳定性和学习效率。仿真实验验证了所提出的MADRL框架在多架CUAV协同路径规划的可行性、有效性和鲁棒性。研究表明:多智能体双延迟-确定策略梯度算法在动态目标位置的协同目标分配与路径规划中具有更好的效果。
展开更多
关键词
无人机
强化学习
网联无人机
多智能体深度强化学习
路径规划
动态目标分配
在线阅读
下载PDF
职称材料
题名
面向多网联无人机的MADRL协同路径规划算法
1
作者
李安
余传鑫
陈成
机构
南昌大学信息工程学院
先进信号处理与智能通信江西省重点实验室
出处
《西安电子科技大学学报》
北大核心
2025年第3期163-175,共13页
基金
国家自然科学基金(62341120)
江西省研究生创新专项资金(YC2021-S151)
江西省自然科学基金(20242BAB26016)。
文摘
针对多架网联无人机执行多个动态目标点巡航监测任务的协同路径规划问题,文中提出了一种基于多智能体深度强化学习的协同动态目标分配与路径规划算法。具体而言,首先对多架CUAV对地通信系统环境建模,在CUAV与蜂窝网络通信连接约束、防碰撞等移动性约束下,构建多架CUAV任务完成总时间和总中断时间加权和最小化优化问题。然后把优化问题离散化并转为马尔可夫博弈。为解决所构建的组合优化问题,提出了基于深度确定性策略梯度的系列算法,有效地处理CUAV之间的合作与竞争关系,且引入一个共享经验池,以提高算法的稳定性和学习效率。仿真实验验证了所提出的MADRL框架在多架CUAV协同路径规划的可行性、有效性和鲁棒性。研究表明:多智能体双延迟-确定策略梯度算法在动态目标位置的协同目标分配与路径规划中具有更好的效果。
关键词
无人机
强化学习
网联无人机
多智能体深度强化学习
路径规划
动态目标分配
Keywords
unmanned aerial vehicle
reinforcement learning
cellular-connected unmanned aerial vehicle
multi-agent deep reinforcement learning
path planning
dynamic target assignment
分类号
TN92 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向多网联无人机的MADRL协同路径规划算法
李安
余传鑫
陈成
《西安电子科技大学学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部