交通信号的智能控制是智能交通研究中的热点问题。为更加及时有效地自适应协调交通,文中提出了一种基于分布式深度强化学习的交通信号控制模型,采用深度神经网络框架,利用目标网络、双Q网络、价值分布提升模型表现。将交叉路口的高维实...交通信号的智能控制是智能交通研究中的热点问题。为更加及时有效地自适应协调交通,文中提出了一种基于分布式深度强化学习的交通信号控制模型,采用深度神经网络框架,利用目标网络、双Q网络、价值分布提升模型表现。将交叉路口的高维实时交通信息离散化建模并与相应车道上的等待时间、队列长度、延迟时间、相位信息等整合作为状态输入,在对相位序列及动作、奖励做出恰当定义的基础上,在线学习交通信号的控制策略,实现交通信号Agent的自适应控制。为验证所提算法,在SUMO(Simulation of Urban Mobility)中相同设置下,将其与3种典型的深度强化学习算法进行对比。实验结果表明,基于分布式的深度强化学习算法在交通信号Agent的控制中具有更好的效率和鲁棒性,且在交叉路口车辆的平均延迟、行驶时间、队列长度、等待时间等方面具有更好的性能表现。展开更多
Make One模式是以应用功能构件为核心的一种新型电子信息设备模式。对Make One应用功能构件的有效描述是构建Make One构件库的基础,是对Make One构件分类、检索的依据。根据Make One模式的特点,提出一种集成式的Make One应用功能构件的...Make One模式是以应用功能构件为核心的一种新型电子信息设备模式。对Make One应用功能构件的有效描述是构建Make One构件库的基础,是对Make One构件分类、检索的依据。根据Make One模式的特点,提出一种集成式的Make One应用功能构件的描述模型MOCDM(Make One Components Description Model);并基于XML,定义了MakeOne应用功能构件的描述语言xMOCDL(XML Based Make One Components Description Language)。最后,给出一个描述实例予以论证。展开更多
文摘交通信号的智能控制是智能交通研究中的热点问题。为更加及时有效地自适应协调交通,文中提出了一种基于分布式深度强化学习的交通信号控制模型,采用深度神经网络框架,利用目标网络、双Q网络、价值分布提升模型表现。将交叉路口的高维实时交通信息离散化建模并与相应车道上的等待时间、队列长度、延迟时间、相位信息等整合作为状态输入,在对相位序列及动作、奖励做出恰当定义的基础上,在线学习交通信号的控制策略,实现交通信号Agent的自适应控制。为验证所提算法,在SUMO(Simulation of Urban Mobility)中相同设置下,将其与3种典型的深度强化学习算法进行对比。实验结果表明,基于分布式的深度强化学习算法在交通信号Agent的控制中具有更好的效率和鲁棒性,且在交叉路口车辆的平均延迟、行驶时间、队列长度、等待时间等方面具有更好的性能表现。
基金国家自然科学基金( the National Natural Science Foundation of China under Grant No.70571032) 。
文摘Make One模式是以应用功能构件为核心的一种新型电子信息设备模式。对Make One应用功能构件的有效描述是构建Make One构件库的基础,是对Make One构件分类、检索的依据。根据Make One模式的特点,提出一种集成式的Make One应用功能构件的描述模型MOCDM(Make One Components Description Model);并基于XML,定义了MakeOne应用功能构件的描述语言xMOCDL(XML Based Make One Components Description Language)。最后,给出一个描述实例予以论证。