期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向高频动态到达的天文卫星机遇目标任务规划方法
1
作者 王旭航 吴海燕 《空间科学学报》 北大核心 2025年第5期1376-1386,共11页
以巡天设备每天将探测到数以万计的变源天体以及对变源天体的观测需求增长为背景,形成了由高频动态到达的机遇目标(ToO)及其后随观测任务组成的长序列任务规划问题.该问题具有观测事件随机性、数据获取高时效性、可选择性多和约束复杂... 以巡天设备每天将探测到数以万计的变源天体以及对变源天体的观测需求增长为背景,形成了由高频动态到达的机遇目标(ToO)及其后随观测任务组成的长序列任务规划问题.该问题具有观测事件随机性、数据获取高时效性、可选择性多和约束复杂的特点,常被视为NP(非确定性多项式)难题,因此获取监督学习的标签数据不易.而针对采用无监督学习的深度强化学习(DRL)方法求解长序列任务规划问题时,卫星作为智能体难以快速收敛至全局最优策略.为此本文借鉴局部注意力(LA)机制的思想对指针网络(PN)进行改进,提出局部注意力指针网络(LA-PN)算法.该算法通过引入时间窗口的方式,使模型专注于对当前决策有重要影响的序列部分,减少了无效探索.通过仿真结果对比分析,验证算法的收益性、实时性和泛化性. 展开更多
关键词 机遇目标 后随观测 任务规划 深度强化学习 局部注意力指针网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部