针对在信号交叉口前由于车辆转向和换道操作频繁容易引发冲突、降低通行效率的问题,构建基于深度强化学习(DQN)的车辆群体控制模型,优化车辆车道选择.首先,利用传感器和网联设备等获取周围车辆及交叉口信号灯实时状态信息,基于共享DQN...针对在信号交叉口前由于车辆转向和换道操作频繁容易引发冲突、降低通行效率的问题,构建基于深度强化学习(DQN)的车辆群体控制模型,优化车辆车道选择.首先,利用传感器和网联设备等获取周围车辆及交叉口信号灯实时状态信息,基于共享DQN模型进行车道选择,并根据该结果计算下一时刻位置、速度和转向角;进一步以效率及安全性指标建立奖励函数对车道选择决策实施评价,将状态信息、决策信息及奖励评价信息整合形成经验,存入同一经验池用于共享DQN模型参数迭代更新;最后,使用SUMO(simulation of urban mobility)与Python联合仿真搭建不同交通流量环境对训练后的模型进行验证.研究表明:相较于SUMO中的车道选择模型,基于共享DQN模型的信号交叉口前车辆群体车道选择模型,在低、中、高流量测试场景的平均速度均有提高,交叉口前排队长度分别减少了9.6%、22.5%和24.8%.本文模型可以有效减少信号交叉口的排队长度、提高信号交叉口前的路段平均速度、增强车辆从上游到达交叉口的效率,为未来车路协同的应用提供理论借鉴和技术支持.展开更多
文摘针对在信号交叉口前由于车辆转向和换道操作频繁容易引发冲突、降低通行效率的问题,构建基于深度强化学习(DQN)的车辆群体控制模型,优化车辆车道选择.首先,利用传感器和网联设备等获取周围车辆及交叉口信号灯实时状态信息,基于共享DQN模型进行车道选择,并根据该结果计算下一时刻位置、速度和转向角;进一步以效率及安全性指标建立奖励函数对车道选择决策实施评价,将状态信息、决策信息及奖励评价信息整合形成经验,存入同一经验池用于共享DQN模型参数迭代更新;最后,使用SUMO(simulation of urban mobility)与Python联合仿真搭建不同交通流量环境对训练后的模型进行验证.研究表明:相较于SUMO中的车道选择模型,基于共享DQN模型的信号交叉口前车辆群体车道选择模型,在低、中、高流量测试场景的平均速度均有提高,交叉口前排队长度分别减少了9.6%、22.5%和24.8%.本文模型可以有效减少信号交叉口的排队长度、提高信号交叉口前的路段平均速度、增强车辆从上游到达交叉口的效率,为未来车路协同的应用提供理论借鉴和技术支持.