期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Q学习的智能交通信号灯优化
被引量:
9
1
作者
宋国治
苏鹏博
+1 位作者
刘畅
陈玉格
《郑州大学学报(理学版)》
CAS
北大核心
2022年第5期57-63,共7页
利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经过卷积网络层进行特征提取,以捕捉更精确、完整的交叉口信息。分别基于相位切换策略和马尔科夫决策过程型...
利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经过卷积网络层进行特征提取,以捕捉更精确、完整的交叉口信息。分别基于相位切换策略和马尔科夫决策过程型(Markov decision process,MDP)动作策略,利用SUMO交通仿真软件进行模拟训练。结果表明,与传统的定时定序信号灯控制策略相比,相位切换策略下车辆的平均等待时间减少了约45%,而MDP动作策略下减少了约78%。
展开更多
关键词
自适应交通信号控制
Q学习
相位切换
马尔科夫决策过程
在线阅读
下载PDF
职称材料
安全驱动的城市交叉口自适应信号控制方法
被引量:
1
2
作者
张功权
常方蓉
+1 位作者
金杰灵
黄合来
《中国安全生产科学技术》
CAS
CSCD
北大核心
2023年第10期192-199,共8页
为提升城市交叉口的交通安全,提出1种安全驱动的自适应交通信号控制方法,以交通安全提升为主,同时优化通行效率和尾气排放。基于多目标深度强化学习,构建信号控制算法框架和双重决斗深度Q网络模型,使用离散交通状态编码定义当前交通状态...
为提升城市交叉口的交通安全,提出1种安全驱动的自适应交通信号控制方法,以交通安全提升为主,同时优化通行效率和尾气排放。基于多目标深度强化学习,构建信号控制算法框架和双重决斗深度Q网络模型,使用离散交通状态编码定义当前交通状态,利用卷积神经网络提取状态特征。针对不同奖励函数量纲无法统一的问题,设计综合奖励函数。基于长沙市交叉口场景和交通流数据,在SUMO搭建实验环境。研究结果表明:在单交叉口真实流量和模拟流量场景下,与现有交通信号控制相比,所提方法在交通冲突频率、车辆行车延误、CO_(2)排放等指标上都表现出更好的性能。研究结果可为城市交叉口安全优化提供参考。
展开更多
关键词
自适应交通信号控制
安全驱动
多目标强化学习
交通
冲突
在线阅读
下载PDF
职称材料
题名
基于Q学习的智能交通信号灯优化
被引量:
9
1
作者
宋国治
苏鹏博
刘畅
陈玉格
机构
天津工业大学计算机科学与技术学院
出处
《郑州大学学报(理学版)》
CAS
北大核心
2022年第5期57-63,共7页
基金
国家自然科学基金项目(61972456)。
文摘
利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经过卷积网络层进行特征提取,以捕捉更精确、完整的交叉口信息。分别基于相位切换策略和马尔科夫决策过程型(Markov decision process,MDP)动作策略,利用SUMO交通仿真软件进行模拟训练。结果表明,与传统的定时定序信号灯控制策略相比,相位切换策略下车辆的平均等待时间减少了约45%,而MDP动作策略下减少了约78%。
关键词
自适应交通信号控制
Q学习
相位切换
马尔科夫决策过程
Keywords
adaptive traffic signal control
Q-learning
phase switching
Markov decision process
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
安全驱动的城市交叉口自适应信号控制方法
被引量:
1
2
作者
张功权
常方蓉
金杰灵
黄合来
机构
中南大学交通运输工程学院
哈佛大学哈佛医学院
中南大学资源与安全工程学院
出处
《中国安全生产科学技术》
CAS
CSCD
北大核心
2023年第10期192-199,共8页
基金
国家自然科学基金项目(71971222)。
文摘
为提升城市交叉口的交通安全,提出1种安全驱动的自适应交通信号控制方法,以交通安全提升为主,同时优化通行效率和尾气排放。基于多目标深度强化学习,构建信号控制算法框架和双重决斗深度Q网络模型,使用离散交通状态编码定义当前交通状态,利用卷积神经网络提取状态特征。针对不同奖励函数量纲无法统一的问题,设计综合奖励函数。基于长沙市交叉口场景和交通流数据,在SUMO搭建实验环境。研究结果表明:在单交叉口真实流量和模拟流量场景下,与现有交通信号控制相比,所提方法在交通冲突频率、车辆行车延误、CO_(2)排放等指标上都表现出更好的性能。研究结果可为城市交叉口安全优化提供参考。
关键词
自适应交通信号控制
安全驱动
多目标强化学习
交通
冲突
Keywords
adaptive traffic signal control
safety-driven
multi-objective reinforcement learning
traffic conflict
分类号
X951 [环境科学与工程—安全科学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Q学习的智能交通信号灯优化
宋国治
苏鹏博
刘畅
陈玉格
《郑州大学学报(理学版)》
CAS
北大核心
2022
9
在线阅读
下载PDF
职称材料
2
安全驱动的城市交叉口自适应信号控制方法
张功权
常方蓉
金杰灵
黄合来
《中国安全生产科学技术》
CAS
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部