期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于随机博弈与A3C深度强化学习的网络防御策略优选
1
作者 胡浩 赵昌军 +3 位作者 刘璟 宋昱欣 姜迎畅 张玉臣 《指挥与控制学报》 CSCD 北大核心 2024年第1期47-58,共12页
网络资源的有限性和攻防对抗的动态性导致最优防御策略难以选取,将深度强化学习引入攻防随机博弈建模领域,通过构建网络攻防actor策略网络和critic价值网络,结合随机博弈模型构建了网络攻防博弈决策模型总体结构,在此基础上引入异步优... 网络资源的有限性和攻防对抗的动态性导致最优防御策略难以选取,将深度强化学习引入攻防随机博弈建模领域,通过构建网络攻防actor策略网络和critic价值网络,结合随机博弈模型构建了网络攻防博弈决策模型总体结构,在此基础上引入异步优势演员评论家算法(asynchronous advantage actor-critic,A3C)智能体学习框架设计了防御策略选取算法;针对现有方法未考虑攻击方群体间的共谋攻击,引入群智能体性格特征,建立合作系数μ来刻画攻击者之间的合作对攻防策略收益的影响,进而得出对防御策略选取的影响,构建的博弈决策模型更符合攻防实际情况。实验结果表明,该方法的策略求解速度要优于现有方法,同时由于考虑了攻击合作关系,能够用于分析攻击者群体间合作关系对防御者决策的影响,防御策略选取更有针对性,期望防御收益更高。 展开更多
关键词 网络攻防 最优防御决策 随机博弈 多智能体 a3C算法
在线阅读 下载PDF
无线传感器网络能量均衡混合拓扑维护策略
2
作者 耿鹏 郝慧珍 +1 位作者 柳艳 叶子馨 《探测与控制学报》 CSCD 北大核心 2024年第1期139-144,共6页
针对恶劣环境下无人值守的无线传感器网络能量受限特性,提出一种时间和能量混合拓扑维护策略,以达到实现节点能量均衡的目的。将拓扑控制分为网络初始化阶段、拓扑构建阶段和拓扑维护阶段,在随机部署和虚拟骨干网络构建的前提下,确立了... 针对恶劣环境下无人值守的无线传感器网络能量受限特性,提出一种时间和能量混合拓扑维护策略,以达到实现节点能量均衡的目的。将拓扑控制分为网络初始化阶段、拓扑构建阶段和拓扑维护阶段,在随机部署和虚拟骨干网络构建的前提下,确立了能量和时间作为拓扑维护触发条件的合理性。仿真表明,所提出的混合拓扑维护策略使网络生命周期提升了44.6%,90%覆盖率结束时间增加了1.4倍,为无线传感器网络的节能部署提供了参考。 展开更多
关键词 无线传感器网络 混合拓扑维护 a3算法 能量均衡
在线阅读 下载PDF
深度强化学习驱动下的智能电网通信网业务路由分配方法研究
3
作者 胡楠 张维 《通信电源技术》 2024年第10期43-45,共3页
在现代化背景下,为确保电力系统的稳定运行,相关人员需要结合实际情况逐步推进智能电网的构建。智能电网以各项数据的获取、处理、保护为核心,建立了集成通信系统。文章针对深度强化学习驱动下的智能电网通信网业务路由分配方法展开分析... 在现代化背景下,为确保电力系统的稳定运行,相关人员需要结合实际情况逐步推进智能电网的构建。智能电网以各项数据的获取、处理、保护为核心,建立了集成通信系统。文章针对深度强化学习驱动下的智能电网通信网业务路由分配方法展开分析,以提高通信资源利用率,提升业务路由方法的稳定性和可靠性。 展开更多
关键词 智能电网 通信网 深度Q网络(DQN)算法 异步优势演员-评论家(a3C)算法 深度学习
在线阅读 下载PDF
基于减少切换次数的Small Cell基站布署方法 被引量:1
4
作者 邓先德 席志红 《邮电设计技术》 2018年第1期72-75,共4页
最新的LTE/LTE-A网络架构中引入了Small Cell概念,通过增加小型基站的布署来提高热点区域内的通信容量和覆盖范围。小基站的布署将不可避免地引入更多的切换,若将用户终端较多的热点区域内的切换次数降到最低,网络整体性能将得到有效提... 最新的LTE/LTE-A网络架构中引入了Small Cell概念,通过增加小型基站的布署来提高热点区域内的通信容量和覆盖范围。小基站的布署将不可避免地引入更多的切换,若将用户终端较多的热点区域内的切换次数降到最低,网络整体性能将得到有效提升。基于A3切换算法,通过理论分析和NS3软件的仿真验证,发现选择合适的拓扑形状,并且使拓扑与路径保持合理的相对位置关系,可以降低单位长度上的切换次数;同时,当用户终端所在的路径经过多个拓扑单元时,不合理的斜率路径可能会引入不必要的切换次数。 展开更多
关键词 SMALL CELL 布署方法 a3切换算法 切换次数 NS3
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部