期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Q学习的智能交通信号灯优化 被引量:9
1
作者 宋国治 苏鹏博 +1 位作者 刘畅 陈玉格 《郑州大学学报(理学版)》 CAS 北大核心 2022年第5期57-63,共7页
利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经过卷积网络层进行特征提取,以捕捉更精确、完整的交叉口信息。分别基于相位切换策略和马尔科夫决策过程型... 利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经过卷积网络层进行特征提取,以捕捉更精确、完整的交叉口信息。分别基于相位切换策略和马尔科夫决策过程型(Markov decision process,MDP)动作策略,利用SUMO交通仿真软件进行模拟训练。结果表明,与传统的定时定序信号灯控制策略相比,相位切换策略下车辆的平均等待时间减少了约45%,而MDP动作策略下减少了约78%。 展开更多
关键词 自适应交通信号控制 Q学习 相位切换 马尔科夫决策过程
在线阅读 下载PDF
安全驱动的城市交叉口自适应信号控制方法 被引量:1
2
作者 张功权 常方蓉 +1 位作者 金杰灵 黄合来 《中国安全生产科学技术》 CAS CSCD 北大核心 2023年第10期192-199,共8页
为提升城市交叉口的交通安全,提出1种安全驱动的自适应交通信号控制方法,以交通安全提升为主,同时优化通行效率和尾气排放。基于多目标深度强化学习,构建信号控制算法框架和双重决斗深度Q网络模型,使用离散交通状态编码定义当前交通状态... 为提升城市交叉口的交通安全,提出1种安全驱动的自适应交通信号控制方法,以交通安全提升为主,同时优化通行效率和尾气排放。基于多目标深度强化学习,构建信号控制算法框架和双重决斗深度Q网络模型,使用离散交通状态编码定义当前交通状态,利用卷积神经网络提取状态特征。针对不同奖励函数量纲无法统一的问题,设计综合奖励函数。基于长沙市交叉口场景和交通流数据,在SUMO搭建实验环境。研究结果表明:在单交叉口真实流量和模拟流量场景下,与现有交通信号控制相比,所提方法在交通冲突频率、车辆行车延误、CO_(2)排放等指标上都表现出更好的性能。研究结果可为城市交叉口安全优化提供参考。 展开更多
关键词 自适应交通信号控制 安全驱动 多目标强化学习 交通冲突
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部