基于DQN算法的倒计时交叉口信号灯配时研究被引量：4

Research on timing of signal light at countdown intersection based on DQN algorithm

在线阅读下载PDF

导出

摘要针对已有的DQN配时算法无法应用在倒计时交叉口的问题,提出以Webster配时法计算绿信比方案,并将其作为控制动作,以归一化车流量、车速、排队长度构造状态矩阵,通过3层全连接神经网络计算动作价值,引入零奖赏延误因子将延误时间转换为奖励值,使用探索率余弦衰减的方式提高收敛能力,使用Huber函数计算误差提高收敛稳定性,最后利用Vissim仿真平台进行测试。结果表明,该方法在延误指标上相比20种固定配时方案均有不同程度的降低,证明了该方法的有效性。 The existing DQN timing algorithm can not be applied to the problem of countdown intersection. The Webster timing method is proposed to calculate the green signal ratio, and it is used as a control action. Normalized vehicle flow, speed and queue length are used to construct the state matrix. The action value was calculated by 3-layer fully connected neural network. A zero reward delay factor is introduced to convert delay time into reward value. Cosine attenuation of exploration rate is used to improve the convergence ability. Using Huber function to calculate error and improve convergence stability. Finally, the VISSIM simulation platform was used for testing. The results show that the delay index of the proposed method is reduced to different degrees compared with the 20 fixed timing schemes, which proves the effectiveness of the proposed method.

作者李珊任安虎白静静 Li Shan;Ren Anhu;Bai Jingjing(School of Electronic and Information Engineering,Xi’an Technological University,Xi’an 710021,China)

机构地区西安工业大学电子信息工程学院

出处《国外电子测量技术》北大核心 2021年第10期91-97,共7页 Foreign Electronic Measurement Technology

基金陕西省科技厅项目(2018GY-153) 陕西省西安市未央区科技局项目(201833)资助。

关键词智能交通信号配时深度强化学习 DQN算法 VISSIM仿真 intelligent transportation signal timing deep reinforcement learning DQN algorithm vissim simulation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

作者简介李珊,硕士研究生,主要研究方向为智能交通信号控制、交通状态监测等。E-mail:1624693146@qq.com;任安虎,硕士,副教授,主要研究方向为智能交通、嵌入式系统设计等。E-mail:591277970@qq.com;白静静,硕士研究生,主要研究方向为通信与信息系统、干线交通协同优化仿真等。E-mail:1046778894@qq.com。

引文网络
相关文献

参考文献7

1张立立,王力,张玲玉.城市道路交通控制概述与展望[J].科学技术与工程,2020,20(16):6322-6329. 被引量：17
2白静静,任安虎,李珊.基于SARSA学习的单交叉口配时优化仿真与设计[J].国外电子测量技术,2020,39(6):76-80. 被引量：4
3康守强,刘哲,王玉静,王庆岩,兰朝凤.基于改进DQN网络的滚动轴承故障诊断方法[J].仪器仪表学报,2021,42(3):201-212. 被引量：28
4喻金忠,曹进德.深度强化学习在交通控制中的应用[J].工业控制计算机,2019,32(6):88-89. 被引量：7
5孙浩,陈春林,刘琼,赵佳宝.基于深度强化学习的交通信号控制方法[J].计算机科学,2020,47(2):169-174. 被引量：30
6牟海维,戚先锋,刘彦昌,孙明港,祁妍嫣.单交叉口多目标联合优化的信号配时研究[J].电子测量与仪器学报,2020,32(9):62-68. 被引量：15
7郭梦杰,任安虎.基于深度强化学习的单路口信号控制算法[J].电子测量技术,2019,42(24):49-52. 被引量：11

二级参考文献62

1宫文峰,陈辉,张美玲,张泽辉.基于深度学习的电机轴承微小故障智能诊断方法[J].仪器仪表学报,2020,41(1):195-205. 被引量：91
2董勋,郭亮,高宏力,刘宸宇,李磊.代价敏感卷积神经网络:一种机械故障数据不平衡分类方法[J].仪器仪表学报,2019,40(12):205-213. 被引量：23
3张淑清,苑世钰,姚玉永,穆勇,王丽丽.基于ICEEMD及AWOA优化ELM的机械故障诊断方法[J].仪器仪表学报,2019,40(11):172-180. 被引量：27
4王飞跃.人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论[J].复杂系统与复杂性科学,2004,1(4):25-35. 被引量：236
5柳祖鹏,刘守阳,李思君,孙剑.交通控制硬件在环仿真平台的开发与实现[J].交通信息与安全,2013,31(3):126-130. 被引量：8
6黄炳强,曹广益,王占全.强化学习原理、算法及应用[J].河北工业大学学报,2006,35(6):34-38. 被引量：19
7侯忠生,许建新.数据驱动控制理论及方法的回顾和展望[J].自动化学报,2009,35(6):650-667. 被引量：222
8于泉,荣建.交通控制硬件在环实时仿真平台设计[J].重庆工学院学报（自然科学版）,2009,23(10):57-60. 被引量：11
9梁骁,殷勇辉,吴颜.单交叉口信号配时的动态优化[J].公路交通技术,2010,26(2):125-127. 被引量：7
10曹成涛,徐建闽.单交叉口交通多目标控制方法[J].计算机工程与应用,2010,46(16):20-22. 被引量：23

共引文献99

1李川,伍依凡,杨帅.不平衡分布的数据驱动故障诊断的研究进展[J].仪器仪表学报,2023,44(8):181-197. 被引量：10
2李洪,刘培邦,汤胜楠,朱勇,周岭.机械装备智能故障诊断研究现状与发展趋势[J].电子技术应用,2021,47(S01):380-389. 被引量：5
3陈瑞阳,周静,王瑞丰,刘鹏飞,罗守华.电子元器件缺陷检测模型的自动训练系统[J].电子测量技术,2023,46(24):31-40.
4邱晓红,徐聪.改进差分进化算法优化多值属性系统诊断策略[J].电子测量技术,2022,45(10):148-154. 被引量：1
5曹红倩.应用改进Q-learning算法解决柔性作业车间调度问题[J].国外电子测量技术,2022,41(4):164-169. 被引量：3
6陈涛.智能信号优化系统在交通领域的技术应用[J].电子测试,2020,31(9):5-7.
7赵婷婷,孔乐,韩雅杰,任德华,陈亚瑞.模型化强化学习研究综述[J].计算机科学与探索,2020,14(6):918-927. 被引量：14
8龙顺忠,王志建,刘皓.网联环境下基于深度强化学习的单路口交通信号控制优化[J].工业控制计算机,2020,33(10):16-19. 被引量：3
9黄翼虎,郭志强.多路口交通灯动态配时研究[J].电子测量技术,2020,43(18):17-20. 被引量：4
10刘志,曹诗鹏,沈阳,杨曦.基于改进深度强化学习方法的单交叉口信号控制[J].计算机科学,2020,47(12):226-232. 被引量：18

同被引文献43

1陈圣磊,吴慧中,肖亮,朱耀琴.基于Metropolis准则的多步Q学习算法与性能仿真[J].系统仿真学报,2007,19(6):1284-1287. 被引量：7
2侯忠生,晏静文.带有迭代学习前馈的快速路无模型自适应入口匝道控制[J].自动化学报,2009,35(5):588-595. 被引量：30
3张建斌,王玲玲,胡玲,常小荣,吴焕淦.艾灸温通作用的理论探讨[J].中国针灸,2011,31(1):51-54. 被引量：171
4路玫,张丽繁,袁晔,于冬冬.隔姜灸、悬灸对不同穴位各时段热感度的对比研究[J].中国针灸,2011,31(3):232-235. 被引量：40
5许培昌,李达良,崔淑丽.不同施灸距离对人体体表皮肤温度的影响——论施灸的安全距离[J].中国针灸,2012,32(7):611-614. 被引量：56
6杨军,张和生,潘成.交通信息采集传感器网络基于强化学习的路由[J].电子测量与仪器学报,2012,26(12):1086-1090. 被引量：3
7周文举,费敏锐,王海宽,王刚,郑敏,刘凯龙.基于迭代学习和卡尔曼滤波的相机精确抓拍控制方法[J].仪器仪表学报,2014,35(5):1044-1051. 被引量：6
8邓丽,黄炎,费敏锐,郑敏,蒋婧.改进的广义预测控制及其在温度系统中的应用[J].仪器仪表学报,2014,35(5):1057-1064. 被引量：20
9郭茂祖,王亚东,刘扬,孙华梅.基于Metropolis准则的Q-学习算法研究[J].计算机研究与发展,2002,39(6):684-688. 被引量：14
10高希言,陈岩,王鑫,陈新旺,高肞,杨旭光,周艳丽,任珊.腹部透灸时温度变化的研究[J].中国针灸,2015,35(1):45-49. 被引量：27

引证文献4

1张博,黄山,张浛芮,李应昆,涂海燕.基于强化学习的艾灸机器人温度控制策略研究[J].电子测量技术,2022,45(24):60-66. 被引量：1
2任安虎,任洋洋,王瑶.多指标优化的深度强化学习单交叉口信号控制[J].国外电子测量技术,2022,41(10):104-111. 被引量：5
3贾光耀,闫飞.基于卡尔曼滤波迭代学习的交通信号控制方法[J].电子测量技术,2023,46(8):126-133. 被引量：4
4张燕,任安虎,陈洋.基于机器视觉的智能交通控制系统设计[J].信息技术,2025,49(2):55-60.

二级引证文献10

1胡玉洲,施佳露.基于VISSIM仿真的城市道路平面交叉口交通组织优化[J].惠州学院学报,2023,43(6):22-27. 被引量：1
2陈国梁,石晴,黄亚飞,曾昭汰.融合注意力机制LSTM网络的城市交叉口信号控制[J].重庆理工大学学报（自然科学）,2024,38(4):196-203.
3刘宜成,杨迦凌,梁斌,陈章.基于强化学习的多段连续体机器人轨迹规划[J].电子测量技术,2024,47(5):61-69. 被引量：4
4叶宝林,陈栋,刘春元,陈滨,吴维敏.基于Dueling Double DQN的交通信号控制方法[J].计算机测量与控制,2024,32(7):154-161.
5崔金魁.基于深度学习和大数据分析的智慧交通流量预测模型研究[J].信息化研究,2024,50(3):16-22. 被引量：2
6马小陆,徐立伟,唐得志,李国强,齐晶晶,瞿元.基于5G-CV2X的多路口智慧公交绿波通行方法[J].沈阳大学学报（自然科学版）,2024,36(4):331-340.
7朱国鑫,周达左,焦竹青.混凝土内部温度场超低功耗测量系统设计[J].仪表技术与传感器,2024(8):71-77.
8何龙,靳斌.基于STM32的铜线放线监测系统设计[J].电子测量技术,2024,47(19):17-23.
9张文利,甘新立,邹俊辉.基于优先贝叶斯与深度Q学习的交通信号工程控制优化研究[J].自动化与仪器仪表,2024(11):96-99.
10高兴媛,和铁行.基于深度确定性策略梯度算法的交通协同智能控制技术分析[J].国外电子测量技术,2025,44(1):54-61.

1胡群灿,马晓旦,付晶燕.基于Vissim仿真的交叉口交通组织优化[J].中国水运,2021(12):142-144. 被引量：3
2张武,赵亮,徐琳,王凡,卢英.基于数字图像相关法在建筑结构变形场中的抗噪研究及应用[J].西安建筑科技大学学报（自然科学版）,2021,53(5):723-728. 被引量：2
3吴鲁香,关醒权,闫磊,吴东平.基于VISSIM仿真的交叉口信号配时优化研究[J].物流工程与管理,2021,43(12):35-38. 被引量：3
4邓佳怡,马昱宇.数字劳工视域下微信视频号用户行为研究[J].青年记者,2021(22):47-48. 被引量：3
5马嘉华,孙兴华,夏文超,王玺钧,谭洪舟,朱洪波.基于标签量信息的联邦学习节点选择算法[J].物联网学报,2021,5(4):46-53. 被引量：4
6马琦.论民间秧歌中丑角的表演特征[J].戏剧之家,2022(1):48-49.
7Mike Picheca.利用智能IoT技术实现资产监控和管理[J].世界电子元器件,2021(8):19-23.
8姜世公,王云飞,吴志力,崔凯,陈庆.基于改进集成学习的交直流配电系统短期负荷预测方法[J].科技通报,2021,37(7):68-73. 被引量：1
9辛蕾,李峰,鲁啸天,赵智祎,赵纪金.面向光学遥感影像的高效编码与重构[J].光学精密工程,2021,29(12):2956-2963. 被引量：6
10黄益平,王勋,胡岠.“十四五”时期中国经济的增长收敛与发展前景[J].武汉大学学报（哲学社会科学版）,2022,75(1):91-100. 被引量：5

国外电子测量技术

2021年第10期

浏览历史

内容加载中请稍等...

基于DQN算法的倒计时交叉口信号灯配时研究被引量：4

参考文献7

二级参考文献62

共引文献99

同被引文献43

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于DQN算法的倒计时交叉口信号灯配时研究 被引量：4

参考文献7

二级参考文献62

共引文献99

同被引文献43

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于DQN算法的倒计时交叉口信号灯配时研究被引量：4