期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于DDQN的电力传感网资源分配算法 被引量:2
1
作者 朱雪琼 胡成博 +1 位作者 杨景刚 路永玲 《中国电力》 CSCD 北大核心 2023年第11期60-66,共7页
电力传感网可以用于对电力网络的设备工作状态和工作环境等信息实时采集和获取,对于电力网络设施的实时监控与快速响应具有重要作用。针对系统在数据排队时延和丢包率上的特殊要求,提出了一种基于强化学习的电力传感网资源分配方案。在... 电力传感网可以用于对电力网络的设备工作状态和工作环境等信息实时采集和获取,对于电力网络设施的实时监控与快速响应具有重要作用。针对系统在数据排队时延和丢包率上的特殊要求,提出了一种基于强化学习的电力传感网资源分配方案。在资源受限的情况下,通过资源分配算法来优化传感器节点的排队时延和丢包率,并将该优化问题建模为马尔可夫决策过程(Markov decision process,MDP),通过双深度Q网络(double deep Q-learning,DDQN)来对优化目标函数求解。仿真结果与数值分析表明,所提方案在收敛性、排队时延和丢包率等方面的性能均优于基准方案。 展开更多
关键词 电力传感网 资源分配 马尔可夫决策过程 双深度Q
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部