基于多智能体深度强化学习的多星观测任务分配方法被引量：1

Multi-Satellite Observation Task Allocation Method Based on Multi-Agent Deep Reinforcement Learning

在线阅读下载PDF

导出

摘要为应对多星环境中复杂多约束条件下的任务分配场景,提出一种多星自主决策观测任务分配算法,该算法采用基于集中式训练、分布式执行的多智能体深度强化学习算法。通过这种方式训练后的卫星智能体,即使在没有中心决策节点或通信受限的情况下,仍具有一定的自主协同能力及独立实现多星观测任务的高效分配能力。 To address the task allocation scenario under complex and constrained conditions in a multi-satellite environment,a multi-satellite autonomous decision-making observation task allocation algorithm is proposed The algorithm uses a multi-agent deep reinforcement learning algorithm based on centralized training and distributed execution The satellite agents trained by this algorithm have certain autonomous collaboration capabilities and the ability to independently achieve the efficient allocation of multi-satellite observation tasks even if there is no central decision-making node or communication restriction.

作者王桢朗何慧群周军金云飞 WANG Zhenlang;HE Huiqun;ZHOU Jun;JIN Yunfei(Shanghai Satellite Engineering Institute,Shanghai 201109,China;Shanghai Academy of Spaceflight Technology,Shanghai 201109,China)

机构地区上海卫星工程研究所上海航天技术研究院

出处《上海航天（中英文）》 CSCD 2024年第1期108-115,共8页 Aerospace Shanghai（Chinese&English）

关键词多智能体系统深度强化学习多星系统多智能体深度确定性策略梯度算法任务规划 multi-agent system deep reinforcement learning multi-satellite system multi-agent deep deterministic policy gradient(MADDPG) mission planning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

作者简介王桢朗(1998-),男,硕士,主要研究方向为任务规划、深度强化学习、卫星应用;通信作者:周军(1982-),男,硕士,研究员,主要研究方向为卫星综合电子、卫星应用。

引文网络
相关文献

参考文献13

1唐嘉钰,李相民,代进进,薄宁.复杂约束条件下异构多智能体联盟任务分配[J].控制理论与应用,2020,37(11):2413-2422. 被引量：13
2贾晓阳,韩莹莹.商业遥感卫星的应用及发展趋势[J].科技资讯,2020,18(18):11-12. 被引量：2
3张飞,陈小前,曹璐,覃江毅,汤敏,郭鹏宇,冉德超.天基边缘计算系统设计及关键技术[J].上海航天（中英文）,2022,39(4):139-146. 被引量：3
4汪昊,冉泳屹,赵雷,王俊霞,雒江涛,张涛.基于深度图强化学习的低轨卫星网络动态路由算法[J].重庆邮电大学学报（自然科学版）,2023,35(4):596-605. 被引量：5
5李升波,刘畅,殷玉明,段京良,王建强,李克强.汽车端到端自动驾驶系统的关键技术与发展趋势[J].人工智能,2023(5):1-16. 被引量：12
6劳天成,刘义,范文慧.多智能体深度确定性策略梯度算法研究与改进[J].新疆大学学报（自然科学版）（中英文）,2023,40(6):717-723. 被引量：2
7张严心,孔涵,殷辰堃,王子豪,黄志清.一类基于概率优先经验回放机制的分布式多智能体软行动-评论者算法[J].北京工业大学学报,2023,49(4):459-466. 被引量：5
8李婧,侯诗琪.环境感知的自适应深度强化学习路由算法[J].计算机工程与设计,2023,44(11):3230-3237. 被引量：2
9张森,张孟炎,邵敬平,普杰信.基于随机策略搜索的多机三维路径规划方法[J].系统仿真学报,2022,34(6):1286-1295. 被引量：2
10张祥文,陈正伟.WGS84与CGCS2000坐标的精密转换方法和程序实现[J].海洋技术学报,2020,39(6):1-7. 被引量：5

二级参考文献75

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：49
2SUN Ping,SHAN Rui.Predictive Control with Velocity Observer for Cushion Robot Based on PSO for Path Planning[J].Journal of Systems Science & Complexity,2020,33(4):988-1011. 被引量：12
3戴健,许菲,陈琪锋.多无人机协同搜索区域划分与路径规划[J].航空学报,2020(S01):149-156. 被引量：35
4唐琴琴,刘旭,张亚生,何辞,李诚成,谢人超,黄韬.边缘计算在星地协同网络中的应用探讨[J].电信科学,2019,35(S02):227-233. 被引量：4
5姚宜斌.高精度GPS测量中坐标基准的统一方法研究[J].地矿测绘,2001,17(2):3-5. 被引量：21
6安雪滢,赵勇,杨乐平,张为华.基于模糊理论的卫星系统效能评估仿真研究[J].系统仿真学报,2006,18(8):2334-2337. 被引量：27
7李国辉,冯明月,易先清.基于分群粒子群优化的传感器调度方法[J].系统工程与电子技术,2010,32(3):598-602. 被引量：10
8叶庆,汪亚夫,邵立,孙晓泉.DSP预警卫星探测能力评估[J].光电工程,2010,37(6):65-72. 被引量：11
9赵砚,张寅生,易东云,张倩.基于PCRLB的低轨星座对自由段多目标的多传感器调度算法[J].宇航学报,2011,32(4):842-850. 被引量：9
10魏子卿,刘光明,吴富梅.2000中国大地坐标系：中国大陆速度场[J].测绘学报,2011,40(4):403-410. 被引量：94

共引文献50

1陆志沣,洪泽华,张励,董晨,钱晓超,宫琳.武器装备体系对抗仿真技术研究[J].上海航天,2019,36(4):42-50. 被引量：8
2张帆,李平川,张正浩,赵杰,唐德礼.基于霍尔离子源的小型化电推力器仿真设计[J].真空科学与技术学报,2021,41(10):993-1000. 被引量：3
3晏冰,夏维,汤航,胡笑旋.基于AHP的卫星应急任务规划方案评估研究[J].合肥工业大学学报（自然科学版）,2021,44(12):1715-1722. 被引量：3
4李双勋,王展.提高雷达测量精度的方位角与原点修正方法[J].光学学报,2022,42(4):96-100. 被引量：2
5郭丁,李姗姗,陈宗信,王力.高分卫星自然资源调查需求满足度评估[J].遥感学报,2022,26(3):579-587. 被引量：6
6岳程斐,薛正华,姚蔚然,曹喜滨.基于机群关系特征的多机协同作战任务分配[J].系统工程与电子技术,2022,44(6):1897-1906. 被引量：3
7柳勇,杨国华,吴宣儒,刘煜,李思维.基于改进MNPSO算法的微电网经济运行优化研究[J].电工电气,2022(7):14-21. 被引量：1
8赵志,段炼,路东林,张杨,邱雪.基于蚁群算法的无人机三维路径规划与冲突解脱[J].航空计算技术,2022,52(4):33-37. 被引量：5
9柳文林,潘子双,韩维,李樾,吴立尧.有人/无人机协同作战运用研究现状与展望[J].海军航空大学学报,2022,37(3):231-241. 被引量：9
10陈秋琼,洪俊,徐华志.基于组合赋权法和Vague集理论的预警卫星探测效能评估[J].探测与控制学报,2022,44(4):104-110. 被引量：1

同被引文献3

1张威,吴涛,马宏,焦义文,蔡洋.智能一体化航天测运控网络发展探析[J].天地一体化信息网络,2021,2(2):82-89. 被引量：10
2刘润滋,丁旭,王燕妮,夏文超,慕桃,杨清海.面向区域目标观测的多星自主协同任务规划方法[J].物联网学报,2024,8(2):81-90. 被引量：1
3付伟,贾洪志,林晓勇,陈金勇,张超,岳群彬.基于分层多智能体的多星联合任务规划架构研究[J].无线电通信技术,2024,50(5):993-999. 被引量：2

引证文献1

1尚希杰,林晓勇,安阳.多星任务下航天测运控与卫星规划的协同机制探析[J].数字技术与应用,2024,42(12):53-55.

1李龙胜,冯文韬,潘可佳,郑言蹊,邓冰妍,景致远.考虑预测不确定性的微电网实时控制策略研究[J].四川电力技术,2024,47(1):22-27. 被引量：1
2李传江,闫慧达,郭延宁,耿远卓,叶睿卿.混合空间目标下的多航天器抵近观测任务规划[J].宇航学报,2023,44(12):1871-1882. 被引量：2
3梁修荣.基于同态加密的无线传感器网络数据安全存储方法[J].自动化与仪器仪表,2023(12):76-80. 被引量：4
4张蓉,刘成龙,邵红伟,周宏飞,张璟.基于改进粒子群算法的多约束随船备件配置优化[J].舰船电子工程,2023,43(11):102-108.
5熊兵,张俊杰,黄思进,陈哲毅,于正欣,陈星.多约束边环境下计算卸载与资源分配联合优化[J].小型微型计算机系统,2024,45(2):405-412.
6廖程建,刘思懿,赵晨羽,张果,侯宏伟,朱瀚然,夏晓晨,许魁.基于多智能体强化学习的空地网络抗干扰传输方法研究[J].移动通信,2024,48(1):71-78. 被引量：1
7王海霞,甘卫华,尤凤翔.基于IMA的AGV群组路径规划仿真[J].计算机仿真,2023,40(12):200-208.
8杨丽丽,唐晓宇,吴思贤,文龙,杨卫中,吴才聪.机耕道自动驾驶农机局部路径规划[J].农业工程学报,2024,40(1):27-36. 被引量：2

上海航天（中英文）

2024年第1期

浏览历史

内容加载中请稍等...

基于多智能体深度强化学习的多星观测任务分配方法被引量：1

参考文献13

二级参考文献75

共引文献50

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多智能体深度强化学习的多星观测任务分配方法 被引量：1

参考文献13

二级参考文献75

共引文献50

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多智能体深度强化学习的多星观测任务分配方法被引量：1