-
题名基于深度强化学习的智能路由技术研究
被引量:7
- 1
-
-
作者
黄万伟
郑向雨
张超钦
王苏南
张校辉
-
机构
郑州轻工业大学软件学院
郑州轻工业大学计算机与通信工程学院
深圳职业技术学院电子与通信工程学院
河南信安通信技术股份有限公司
-
出处
《郑州大学学报(工学版)》
CAS
北大核心
2023年第1期44-51,共8页
-
基金
国家自然科学基金资助项目(62002382,62072416)
河南省重点研发与推广专项(科技攻关)(222102210175,222102210111)
2022年河南省专业学位研究生精品教学案例项目(YJS2022AL035)。
-
文摘
针对现有智能路由算法收敛速度慢、平均时延高、带宽利用率低等问题,提出了一种基于深度强化学习(DRL)的多路径智能路由算法RDPG-Route。该算法采用循环确定性策略梯度(RDPG)作为训练框架,引入长短期记忆网络(LSTM)作为神经网络,基于RDPG处理高纬度问题的算法优势,以及LSTM循环核中记忆体的存储能力,将动态变化的网络状态输入神经网络进行训练。算法训练收敛后,将神经网络输出的动作值作为网络链路权重,基于多路径路由策略进行流量划分,以实现网络路由的智能动态调整。最后,将RDPG-Route路由算法分别与ECMP、DRL-TE和DRL-R-DDPG路由算法进行对比。结果表明,RDPG-Route具有较好的收敛性和有效性,相比于其他智能路由算法至少降低了7.2%平均端到端时延,提高了6.5%吞吐量,减少了8.9%丢包率和6.3%的最大链路利用率。
-
关键词
体验质量
软件定义网络
深度强化学习
路由算法
循环确定性策略梯度
-
Keywords
quality of experience
software defined network
deep reinforcement learning
routing algorithms
re-current deterministic policy gradient
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-