-
题名基于网联车辆轨迹信息的交通信号近端策略优化方法
- 1
-
-
作者
徐图
庞钰琪
李强伟
-
机构
浙江警察学院交通管理工程学院
之江实验室
-
出处
《无线电通信技术》
北大核心
2025年第3期631-639,共9页
-
基金
浙江省自然科学基金(LQ24E080019)。
-
文摘
交通信号控制效果直接影响交通系统的运行质量,基于强化学习的交通信号控制具有无模型、自适应的优点。针对现有强化学习交通信号控制方法忽略车辆微观行为的问题,通过对网联车辆轨迹信息的精细建模,利用智能驾驶模型(Intelligent Driver Model,IDM)估计车辆跟驰行为的参数,精准快速刻画了路口车辆的驾驶风格。将IDM参数与车道占有率融合构建状态空间,设计了一种基于网联车辆轨迹信息的交通信号近端策略优化(Trajectory-based Proximal Policy Optimization,TPPO)方法。在城市交通微观模拟软件SUMO(Simulation of Urban Mobility)上开展的仿真实验表明,相比于其他强化学习控制方法,该方法收敛速度更快,车辆平均排队长度更短,有效提升了路口交通效率。
-
关键词
网联自动驾驶
车辆轨迹
强化学习
交通信号控制
-
Keywords
connected automated vehicles
vehicle trajectory
reinforcement learning
traffic signal control
-
分类号
U491
[交通运输工程—交通运输规划与管理]
-