基于强化学习方法的ATM网络ABR流量控制被引量：2

Reinforcement Learning Approach to ABR Traffic Control of ATM Networks

在线阅读下载PDF

导出

摘要针对异步传输模式(ATM)网络的拥塞问题,将强化学习方法应用于拥塞控制器的设计之中.该方法不依赖于网络的数学模型和先验知识,而是通过试错和与环境的不断交互获得知识,从而改进行为策略,具有自学习的能力.控制器通过调节可用比特速率(ABR)业务发送数据的速率,使网络中可能发生拥塞的节点的缓冲器队列长度逼近给定值,从而避免拥塞的发生,保证网络的稳定运行.通过一系列仿真实验验证了该方法的有效性. The reinforcement learning approach is applied to the design of controller to solve the congestion problem in ATM（asynchronous transfer mode） networks. This approach does not rely on the mathematic model and priori-knowledge of network, but acquires the knowledge through trial-and-error method and interacts with environmental conditions to improve its behavior strategy. So, it has the self-learning ability and the queue length of buffer at bottleneck node thus approximates to the set value by readjusting the source traffic rate in the ABR（available bit rate） service. The stability of the system is therefore provided and able to avoid possible occurrence of congestion. Simulation results show the effectiveness of the approach proposed.

作者李鑫井元伟任涛张阳

机构地区东北大学信息科学与工程学院沈阳市东陵农电局

出处《东北大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第1期17-20,共4页 Journal of Northeastern University(Natural Science)

基金国家自然科学基金资助项目(62074009) 流程工业综合自动化教育部重点实验室开放课题

关键词 ATM网络 ABR业务拥塞控制流量控制强化学习 ATM network ABR service congestion control traffic control reinforcement learning

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

作者简介李鑫（1982-），男，辽宁沈阳人，东北大学博士研究生；Correspondent： LI Xin, E-mail： lixin820106@126.com 井元伟（1956-），男，辽宁西丰人，东北大学教授，博士生导师．

引文网络
相关文献

参考文献10

1Jagannathan S.Predictive congestion control of ATM networks:multiple sources/single buffer scenario[J].Automatica,2002,38(5):815-820.
2Lee S J,Hou C L.Neural-fuzzy system for congestion control in ATM networks[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2000,30(1):2-9.
3任涛,井元伟.基于PSO-PID的ABR流量控制[J].东北大学学报（自然科学版）,2007,28(1):14-18. 被引量：3
4Gnerin E,Habib I W,Palazzo S,et al.Intelligent techniques in high speed networks[J].IEEE Journal on Selected Areas in Communications,2000,10(2):145-155.
5高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：285
6张雁冰,杭大明,马正新,曹志刚.基于再励学习的主动队列管理算法[J].软件学报,2004,15(7):1090-1098. 被引量：7
7Chatovich A,Okug S,Dundar G.Hierarchical neuro-fuzzy call admission controller for ATM networks[J].Computer Communications,2001,24:1031-1044.
8Hsiao M C,Hwang K S,Tan S W,et al.Reinforcement learning congestion controller for multimedia surveillance system[C]∥Proceedings of the 2003 IEEE International Conference on Robotics and Automation.Taipei:Institute of Electrical and Electronics Engineers Inc,2003:4403-4407.
9Hsiao M C,Tan S W,Hwang K S,et al.A reinforcement learning approach to congestion control of high-speed multimedia networks[J].Cybernetics and Systems,2005,36(2):181-202.
10Rajesh M,Kandadai,Tien J M.A knowledge-based generating hierarchical fuzzy-neural controller[J].IEEE Transactions on Neural Networks,1997,8(6):1531-1540.

二级参考文献33

1王建辉,黄敏,顾树生.基于PSO的板形板厚小波神经网络解耦PID控制[J].东北大学学报（自然科学版）,2005,26(3):224-227. 被引量：5
2[1]Jacobson V, Karels MJ. Congestion avoidance and control. ACM SIGCOMM Computer Communication Review, 1988,18(4):314～329.
3[2]Floyd S, Jacobson V. Random early detection gateways for congestion avoidance. IEEE/ACM Trans. on Networking, 1993,1(4):397～413.
4[3]Floyd S. A report on some recent development in TCP congestion control. IEEE Communication Magazine, 2001,39(4):84～90.
5[4]Christiansen M, Jeffay K, Ott D, Smith FD. Tuning RED for Web traffic. In: Proc. of the ACM SIGCOMM 2000. Stockholm: ACM Press, 2000. 139～150.
6[5]Ott TJ, Lakshman TV, Wong LH. SRED: Stabilized RED. In: Proc. of the INFOCOM'99. New York: IEEE Communications Society, 1999. 1346～1355.
7[6]Lin D, Morris R. Dynamics of random early detection. In: Proc. of the SIGCOMM'97. Cannes: ACM Press, 1997. 127～137.
8[7]Anjum F, Tassiulas L. Balanced-RED: An algorithm to achieve fairness in Internet. http://www.isr.umd.edu/CSHCN/
9[8]Feng W, Kandlur DD, Saha D, Shin KG. A self-configuring RED gateway. In: Proc. of the INFOCOM'99. New York: IEEE Communications Society, 1999. 1320～1328.
10[9]Feng W, Kandlur DD, Saha D, Shin KG. Blue: A new class of active queue management algorithms. Technical Report, UM CSE-TR-387-99, 1999.

共引文献291

1项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
2安萌萌,樊秀梅,蔡含宇.基于雾计算和强化学习的交通灯智能协同控制研究[J].计算机应用研究,2020,37(2):465-469. 被引量：9
3丁志梁,潘毅群(指导),谢建彤,王尉同,黄治钟.强化学习算法在空调系统运行优化中的应用研究[J].建筑节能,2020(7):14-20. 被引量：10
4王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.
5马庆刘,喻鹏,吴佳慧,熊翱,颜拥.基于深度强化学习的综合能源业务通道优化机制[J].北京邮电大学学报,2020,43(2):87-93. 被引量：1
6赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
7周济,陈锋.基于强化神经网络的区域协调控制研究[J].电子技术（上海）,2010(9):20-22.
8卓睿,陈宗海,陈春林.基于强化学习和模糊逻辑的移动机器人导航[J].计算机仿真,2005,22(8):157-162. 被引量：5
9魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
10沈晶,顾国昌,刘海波.分层强化学习研究综述[J].模式识别与人工智能,2005,18(5):574-581. 被引量：7

同被引文献13

1Luo Mingwei Beijing University of Posts and Telecommunications.Analysis on Implementation of Asymmetric Regulation in China Telecommunications Sector[J].China Communications,2008,5(3):104-107. 被引量：1
2张黎.控制图和EWMA控制图的灵敏性分析[J].辽宁工程技术大学学报（自然科学版）,2005,24(4):602-604. 被引量：3
3张涛,吴汉生.基于神经网络的强化学习算法实现倒立摆控制[J].计算机仿真,2006,23(4):298-300. 被引量：7
4王瑞霞,孙亮,阮晓钢.基于强化学习的二级倒立摆控制[J].计算机仿真,2006,23(4):305-308. 被引量：3
5叶德谦,杨樱,金大兵.基于神经网络集成的强化学习算法系统设计[J].计算机工程与应用,2006,42(12):97-99. 被引量：2
6黄炳强,曹广益,王占全.强化学习原理、算法及应用[J].河北工业大学学报,2006,35(6):34-38. 被引量：19
7侯凤成,刘弘.基于Q学习的生物序列比对方法[J].信息技术与信息化,2007(2):85-88. 被引量：1
8秦政,丁福光,边信黔.强化学习在移动机器人自主导航中的应用[J].计算机工程与应用,2007,43(18):215-217. 被引量：5
9郭力,张尧,胡金磊.基于强化学习算法的自适应直流附加阻尼控制器[J].电力自动化设备,2007,27(10):87-91. 被引量：3
10徐洁,付金华.神经网络在计算机辅助企业决策模型中的应用[J].郑州轻工业学院学报（自然科学版）,2008,23(3):66-68. 被引量：1

引证文献2

1曾智刚.基于强化学习的神经网络在船模速度控制中的应用[J].计算机时代,2009(4):24-25. 被引量：1
2王安平,李原,林琳.Q-Learning-Based Inter-Networking Mobile Number Portability Congestion Control Mechanism[J].China Communications,2011,8(5):165-172.

二级引证文献1

1方小菊.基于强化学习的采摘机器人采摘臂避碰设计[J].农机化研究,2017,39(11):198-202. 被引量：4

1何永明.ATM网络中ABR业务的拥塞控制研究进展[J].世界网络与多媒体,1998,6(12):56-57.
2刘益林,顾尚杰.ATM网络中的ABR业务管理[J].计算机工程,1997,23(6):25-27.
3刘益林,顾尚杰,诸鸿文.基于ABR业务模型的TCP协议性能分析[J].计算机工程,1998,24(5):18-20. 被引量：1
4于希宁,管志敏,魏文超,王毅佳.自适应模糊PID控制在ATM网络流量控制中的应用[J].华北电力大学学报（自然科学版）,2006,33(6):59-62. 被引量：1
5肖蕾,吴捷.一种基于ABR业务的自适应流量控制策略[J].计算机工程与科学,2006,28(8):111-112.
6郑守超,李雪.ABR业务的拥塞控制研究[J].科技信息,2009(7):52-53.
7董庆阳,李毓麟.ABR业务流量控制中的是速率反馈[J].通信技术与发展,1998(3):19-20.
8黄波,周乾南.多层Turbo空时编码[J].电信资料,2005(3):9-15.
9张文逸,杨家本.基于MAS的高性能网络拥塞控制研究[J].北京理工大学学报（社会科学版）,2002,4(B10):6-11.
10谢利超,刘宏立.一种可以减小控制时延的ABR业务流量控制方案[J].计算机工程与应用,2004,40(18):169-170.

东北大学学报（自然科学版）

2008年第1期

浏览历史

内容加载中请稍等...

基于强化学习方法的ATM网络ABR流量控制被引量：2

参考文献10

二级参考文献33

共引文献291

同被引文献13

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习方法的ATM网络ABR流量控制 被引量：2

参考文献10

二级参考文献33

共引文献291

同被引文献13

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习方法的ATM网络ABR流量控制被引量：2