-
题名基于合作博弈和强化学习的优先信号控制方法
被引量:1
- 1
-
-
作者
秦浩
张维石
-
机构
大连海事大学信息科学技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第11期3350-3356,共7页
-
基金
大连市公交集团重点资助项目。
-
文摘
针对智能交通系统优先信号控制效率低问题,提出一种基于合作博弈与强化学习混合决策的八相位优先信号控制方法CBQL-TSP。该方法将公交信号优先权分配抽象成一个八相位信号时序的多目标决策问题,将信号相序细化为优先相位与非优相位,构建合作博弈模型。提出一种混合决策算法CBQL,解决八相位信号时序的多目标决策问题,通过求解夏普利值函数获取博弈各成员边缘贡献,根据夏普利值比构建状态转移概率方程。与常见控制方法相比,CBQL-TSP具有合作博弈的公平性原则和Q-learning的适应性学习能力,能够根据实时交通状况动态调整信号时序,在优先信号控制上具有更高的灵活性和效率。建立仿真测试平台,比较不同需求量下系统平均等待车数和平均通行时间,评估方法的稳定性和效率。实验结果表明,提出方法具有更高的稳定性,并且整体平均通行时间减少了约24.57%,公交平均通行时间减少约37.40%。CBQL-TSP在公交优先路口具有更高的控制效率,可显著减少整体和公交平均通行时间。
-
关键词
交通信号优先控制
合作博弈
强化学习
八相位优先信号
-
Keywords
transit signal priority(TSP)
coalitional bargaining
reinforcement learning
eight-phase priority signal
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-