基于深度强化学习的自适应交通信号控制研究被引量：6

Adaptive Traffic Signal Control Based on Deep Reinforcement Learning

在线阅读下载PDF

导出

摘要为了提高交通控制算法的适应性和鲁棒性,缓解城市交通拥堵,提出了一种改进的D3QN(dueling double deep Q-network, D3QN)自适应信号控制方法。首先对几种强化学习自适应控制模式进行分析,然后在固定步长动作模式的基础上提出了不定步长动作模式,并构造了一种基于空间占有率的奖励函数;最后使用Sumo软件,对中山市东区街道某交叉口分别在稳定流和随机流场景下进行仿真。仿真结果表明:该方法具有良好的收敛性,有效地降低了延误时间和排队长度。 In order to improve the robustness and adaptability of traffic control algorithms and ease urban traffic congestion,an adaptive traffic signal control method based on improved D3QN(dueling double deep Q-network,D3QN)was proposed.Firstly,several adaptive traffic control modes based on reinforcement learning were analyzed.Subsequently,a variable step-size action mode was proposed based on the fixed step-size action mode and a reward function based on space occupancy was constructed.Finally,an intersection in East Street of Zhongshan was simulated by software Sumo in steady flow and stochastic flow.The simulation results show that the proposed method exhibits excellent convergence and effectively reduces the delay time and the queue length.

作者徐建闽周湘鹏首艳芳 XU Jianmin;ZHOU Xiangpeng;SHOU Yanfang(School of Civil and Transportation Engineering,South China University of Technology,Guangzhou 510640,Guangdong,China;Guangzhou Institute of Modern Industrial Technology,South China University of Technology,Guangzhou 510640,Guangdong,China)

机构地区华南理工大学土木与交通学院华南理工大学广州现代产业技术研究院

出处《重庆交通大学学报（自然科学版）》 CAS CSCD 北大核心 2022年第8期24-29,共6页 Journal of Chongqing Jiaotong University(Natural Science)

基金国家自然科学基金面上项目(61873098) 广东省自然科学基金项目(2018A030313250) 广东省科技计划项目(2016A030305001)。

关键词交通工程交通仿真自适应控制交通流深度强化学习 traffic engineering traffic simulation adaptive control traffic flow deep reinforcement learning

分类号 U491.51 [交通运输工程—交通运输规划与管理]

作者简介第一作者:徐建闽(1960-),男,山东招远人,教授,博士,主要从事智能交通控制方面的研究。E⁃mail:aujmxu@scut.edu.cn。

引文网络
相关文献

参考文献6

1郭海锋,程君,方良君,彭起涛.短时预测下的单点交叉口无模型自适应控制方法[J].中国公路学报,2014,27(12):88-95. 被引量：4
2徐建闽,李岿林,翟春杰,肖雅惠.基于短时交通流预测的单交叉口自适应控制[J].重庆交通大学学报（自然科学版）,2018,37(9):73-78. 被引量：7
3卢守峰,韦钦平,刘喜敏.单交叉口信号配时的离线Q学习模型研究[J].控制工程,2012,19(6):987-992. 被引量：5
4赖建辉.基于D3QN的交通信号控制策略[J].计算机科学,2019,46(S11):117-121. 被引量：10
5孙浩,陈春林,刘琼,赵佳宝.基于深度强化学习的交通信号控制方法[J].计算机科学,2020,47(2):169-174. 被引量：29
6王云鹏,郭戈.基于深度强化学习的有轨电车信号优先控制[J].自动化学报,2019,45(12):2366-2377. 被引量：16

二级参考文献33

1方琴,李永前.K近邻短期交通流预测[J].重庆交通大学学报（自然科学版）,2012,31(4):828-831. 被引量：13
2刘洋,马寿峰.基于聚类分析的非参数回归短时交通流预测方法[J].交通信息与安全,2013,31(2):27-31. 被引量：13
3李君羡,童文聪,杨磊.常规交叉口信号控制方案选择逻辑分析[J].交通信息与安全,2013,31(5):36-40. 被引量：6
4赵忠杰,刘小强,谢光秋.单交通路口变相位变周期信号控制[J].长安大学学报（自然科学版）,2005,25(6):70-72. 被引量：30
5王秋平,谭学龙,张生瑞.城市单点交叉口信号配时优化[J].交通运输工程学报,2006,6(2):60-64. 被引量：110
6承向军,常歆识,杨肇夏.基于Q-学习的交通信号控制方法[J].系统工程理论与实践,2006,26(8):136-140. 被引量：14
7侯忠生.无模型自适应控制的现状与展望[J].控制理论与应用,2006,23(4):586-592. 被引量：132
8闫茂德,贺昱曜,吴青云.一类非线性系统具有L_2-增益的鲁棒自适应控制[J].长安大学学报（自然科学版）,2006,26(6):102-105. 被引量：4
9周小鹏,冯奇,孙立军.基于最近邻法的短时交通流预测[J].同济大学学报（自然科学版）,2006,34(11):1494-1498. 被引量：22
10赵晓华,李振龙,陈阳舟,李云驰.基于混杂系统Q学习最优控制的信号灯控制方法[J].高技术通讯,2007,17(5):498-502. 被引量：5

共引文献63

1卢守峰,张术,刘喜敏.单交叉口多相位在线Q学习交通控制模型[J].交通科学与工程,2014,30(1):72-79. 被引量：3
2毛盈方,卢守峰.基于风险避免强化学习的单交叉口配时优化[J].交通科学与工程,2014,30(1):80-85.
3卢守峰,张术,刘喜敏.平均排队长度差最小的单交叉口在线Q学习模型[J].公路交通科技,2014,31(11):116-122. 被引量：6
4徐建闽,李岿林,翟春杰,肖雅惠.基于短时交通流预测的单交叉口自适应控制[J].重庆交通大学学报（自然科学版）,2018,37(9):73-78. 被引量：7
5毕云蕊,刘娣,刘坤.城市交通流预测方法阐述与分析[J].城市建设理论研究（电子版）,2019,0(15):160-160.
6宋佳运.基于TdPN的中小流量交叉口信号控制研究[J].计算机测量与控制,2020,28(2):112-116. 被引量：2
7王鹏勇,陈龚涛,赵江烁.基于深度强化学习的机场出租车司机决策方法[J].计算机与现代化,2020(8):94-99.
8孙长银,穆朝絮.多智能体深度强化学习的若干关键科学问题[J].自动化学报,2020,46(7):1301-1312. 被引量：93
9南英,蒋亮.基于深度强化学习的弹道导弹中段突防控制[J].指挥信息系统与技术,2020,11(4):1-9. 被引量：10
10王嘉文,杭佳宇,李思洁,周溪召.自适应信号控制交叉口行程时间可靠性[J].系统工程,2020,38(5):109-117. 被引量：4

同被引文献40

1陈嘉豪,周扬华.高速公路路侧监控技术智能化提升方向浅析[J].中国交通信息化,2021(S01):145-147. 被引量：2
2宫晓燕,康胜.“潮汐式”交通中可变通道的通行方向切换算法的研究与应用[J].交通运输系统工程与信息,2006,6(6):33-40. 被引量：26
3周立平,董红利.信号交叉口转向可变车道长度研究[J].交通信息与安全,2009,27(2):56-58. 被引量：22
4卢守峰,韦钦平,沈文,刘喜敏.集成VISSIM、Excel VBA和MATLAB的仿真平台研究[J].交通运输系统工程与信息,2012,12(4):43-48. 被引量：18
5谭真,黄志义,梅振宇.主路协调下单点TSP策略关键控制参数仿真优化[J].交通运输系统工程与信息,2012,12(4):64-71. 被引量：2
6万绪军,陆化普.实时自适应交通信号控制优化理论模型[J].交通运输工程学报,2001,1(4):60-66. 被引量：26
7林浩,张宁.信号交叉口可变导向车道感应控制优化[J].现代交通技术,2017,14(1):65-68. 被引量：4
8徐成成,郑亮,薛新风.集成VISSIM/VISUM与MATLAB的多精度仿真控制平台研究[J].物流科技,2019,42(1):65-68. 被引量：2
9尚春琳,刘小明,沈辉,田玉林,李丽丽,唐少虎.潮汐车道清空与下游路口信号协同控制方法研究[J].交通运输系统工程与信息,2019,19(2):52-59. 被引量：10
10吴庆哲,周俊.基于模糊控制的多路口路段交通信号灯信号周期的研究[J].工业控制计算机,2019,32(6):81-82. 被引量：5

引证文献6

1赵红专,李林,周旦,陈建鹏,展新.车联网环境下的可变单向交通控制算法研究[J].重庆交通大学学报（自然科学版）,2023,42(6):111-118.
2宋太龙,贺玉龙,刘钦.基于深度强化学习的大型活动关键交叉口信号控制[J].科学技术与工程,2023,23(22):9694-9701. 被引量：1
3管德永,徐越,王可.基于动态灵敏度的感应控制优化方法[J].交通运输系统工程与信息,2023,23(4):124-133.
4胡玉洲,施佳露.基于VISSIM仿真的城市道路平面交叉口交通组织优化[J].惠州学院学报,2023,43(6):22-27. 被引量：1
5刘文光.基于智能交通技术的高速公路安全设施设计与应用[J].交通世界,2024(4):13-15. 被引量：2
6肖平辉,李旭芳,刘洁.基于实时交通流分析的信号优化控制仿真平台研究[J].厦门科技,2024,30(2):59-62.

二级引证文献4

1苏港,叶宝林,姚青,陈滨,张一嘉.基于改进多智能体Nash Q Learning的交通信号协调控制[J].软件工程,2024,27(10):43-49.
2尹恋,黄文涵,李军成.几种交通信号灯配时优化方法的对比分析[J].电子元器件与信息技术,2024,8(8):100-105.
3何海滨.智能交通工程在提高高速公路安全性中的应用研究[J].人民公交,2024(22):137-139.
4樊玲.智能交通系统中基于图像识别的照明优化策略[J].中国照明电器,2025(1):101-103.

1薛睿.福州市堵点通行能力提升研究——以尤溪洲大桥为例[J].福建建材,2022(8):64-67.
2宋国治,苏鹏博,刘畅,陈玉格.基于Q学习的智能交通信号灯优化[J].郑州大学学报（理学版）,2022,54(5):57-63. 被引量：8
3夏新海,许伦辉,杨景山,彭智敏.信号交叉口相位间谈判博弈协调控制[J].公路交通科技,2022,39(4):131-139. 被引量：1
4高健.Dynamo参数化编程在地下综合管廊建模中的应用[J].现代信息科技,2022,6(5):113-117. 被引量：2
5秦严严,朱宜文,朱立,唐鸿辉.智能网联卡车车队混合流通行能力分析方法[J].交通运输系统工程与信息,2022,22(4):275-282. 被引量：3
6谭百宏,邱志军,张祎,何书贤.网联环境下考虑非优先车辆延误的公交优先信号控制方法[J].交通信息与安全,2022,40(3):86-95. 被引量：7

重庆交通大学学报（自然科学版）

2022年第8期

浏览历史

内容加载中请稍等...

基于深度强化学习的自适应交通信号控制研究被引量：6

参考文献6

二级参考文献33

共引文献63

同被引文献40

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的自适应交通信号控制研究 被引量：6

参考文献6

二级参考文献33

共引文献63

同被引文献40

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的自适应交通信号控制研究被引量：6