期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
具有精英策略的深度强化学习无人机集群通信网络拓扑设计 被引量:9
1
作者 董方昊 冯有前 +3 位作者 尹忠海 梁晓龙 周诚 李明杰 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2019年第4期52-58,共7页
针对集群无人机背景下定向天线网络拓扑设计的NP-hard特点,基于网络高抗毁、低功耗、高稳定性等要求,以抗毁性(3-连通)、链路量、链路功耗和稳定性为奖励,提出了一种具有精英策略的深度强化学习通信网络拓扑生成算法,验证了精英经验池... 针对集群无人机背景下定向天线网络拓扑设计的NP-hard特点,基于网络高抗毁、低功耗、高稳定性等要求,以抗毁性(3-连通)、链路量、链路功耗和稳定性为奖励,提出了一种具有精英策略的深度强化学习通信网络拓扑生成算法,验证了精英经验池加速训练效果。与传统DQN相比,引入精英经验池能够有效加速模型收敛,训练时间减少3倍以上。与遗传算法相比,算法分离了训练与使用过程,当网络训练完成后,能够根据场景需要实时计算通信网络拓扑。实验阶段设计了随机给定空间位置的6节点、10节点、24节点和36节点的3-连通通信网络拓扑。实验结果表明:所提算法具有强的实时性和适用性,对于不大于36节点的网络,可在183 ms内实现网络拓扑的更新计算,达到了实际应用的实时性要求。 展开更多
关键词 强化学习 精英经验池 通信网络连通度 通信网络拓扑
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部