期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于柔性演员-评论家算法的决策规划协同研究
被引量:
2
1
作者
唐斌
刘光耀
+3 位作者
江浩斌
田宁
米伟
王春宏
《交通运输系统工程与信息》
EI
CSCD
北大核心
2024年第2期105-113,187,共10页
为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与...
为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与基于规则的决策规划方法相结合设计自动驾驶决策规划协同智能体。结合自注意力机制(Self Attention Mechanism, SAM)和门控循环单元(Gate Recurrent Unit, GRU)构建预处理网络;根据规划模块的具体实现方式设计动作空间;运用信息反馈思想设计奖励函数,给智能体添加车辆行驶条件约束,并将轨迹信息传递给决策模块,实现决策规划的信息协同。在CARLA自动驾驶仿真平台中搭建交通场景对智能体进行训练,并在不同场景中将所提出的决策规划协同方法与常规的基于SAC算法的决策规划方法进行比较,结果表明,本文所设计的自动驾驶决策规划协同智能体学习速度提高了25.10%,由其决策结果生成的平均车速更高,车速变化率更小,更接近道路期望车速,路径长度与曲率变化率更小。
展开更多
关键词
智能交通
自动驾驶
柔性
演员
-
评论家
算法
决策规划协同
深度强化学习
在线阅读
下载PDF
职称材料
基于改进强化学习的移动机器人动态避障方法
被引量:
8
2
作者
徐建华
邵康康
+1 位作者
王佳惠
刘学聪
《中国惯性技术学报》
EI
CSCD
北大核心
2023年第1期92-99,共8页
针对未知环境下移动机器人动态避障存在规划轨迹长、行驶速度慢和鲁棒性差等问题,提出一种基于改进强化学习的移动机器人动态避障方法。移动机器人根据自身速度、目标位置和激光雷达信息直接得到动作信号,实现端到端的控制。基于距离梯...
针对未知环境下移动机器人动态避障存在规划轨迹长、行驶速度慢和鲁棒性差等问题,提出一种基于改进强化学习的移动机器人动态避障方法。移动机器人根据自身速度、目标位置和激光雷达信息直接得到动作信号,实现端到端的控制。基于距离梯度引导和角度梯度引导促使移动机器人向终点方向优化,加快算法的收敛速度;结合卷积神经网络从多维观测数据中提取高质量特征,提升策略训练效果。仿真试验结果表明,在多动态障碍物环境下,所提方法的训练速度提升40%、轨迹长度缩短2.69%以上、平均线速度增加11.87%以上,与现有主流避障方法相比,具有规划轨迹短、行驶速度快、性能稳定等优点,能够实现移动机器人在多障碍物环境下平稳避障。
展开更多
关键词
移动机器人
动态避障
强化学习
柔性演员评论家算法
卷积神经网络
在线阅读
下载PDF
职称材料
考虑进站策略的网联电动公交车节能驾驶优化研究
3
作者
南斯睿
于谦
+2 位作者
李铁柱
尚赞娣
陈海波
《交通运输系统工程与信息》
2025年第2期82-94,共13页
针对公交车在进出站和信号交叉口高能耗的问题,本文提出一种考虑进站策略的节能驾驶优化方法。首先,基于利用城市交通能力仿真(Simulation of Urban Mobility, SUMO)平台搭建智能网联场景,构建能够反映能耗、行驶效率和安全性的强化学...
针对公交车在进出站和信号交叉口高能耗的问题,本文提出一种考虑进站策略的节能驾驶优化方法。首先,基于利用城市交通能力仿真(Simulation of Urban Mobility, SUMO)平台搭建智能网联场景,构建能够反映能耗、行驶效率和安全性的强化学习复合奖励函数;其次,将进站策略和预设交通规则作为约束集成于柔性演员-评论家(Soft Actor-Critic, SAC)深度强化学习框架中,优化车辆进出站及接近信号交叉口的轨迹;最后,以实际行驶、基于深度Q网络(Deep Q-Network, DQN)算法常规、基于SAC算法、基于规则约束和DQN算法(DQN-ruled)的优化方法作为基准方案,与本文提出的基于规则约束和SAC算法(SAC-ruled)的优化方法进行对比。结果表明:通过SAC-ruled算法优化后的驾驶轨迹在多种场景下均优于基准方案。在跟驰运动中,与基准方案相比,所设计的节能驾驶优化方法较基准方案的车辆能耗最高减少35.97%,行驶时间提升21.67%;在换道运动中,车辆能耗最多可降低41.40%,行驶时间提升16.94%。此外,通过敏感性分析验证,本文提出的基于SAC-ruled算法的节能驾驶优化方法在应对车流量波动方面表现出更强的适应性。本文建立的节能驾驶优化模型可集成节能辅助驾驶系统,鼓励驾驶员主动节能。
展开更多
关键词
智能交通
节能驾驶优化
深度强化学习
纯电动公交
柔性
演员
-
评论家
算法
在线阅读
下载PDF
职称材料
题名
基于柔性演员-评论家算法的决策规划协同研究
被引量:
2
1
作者
唐斌
刘光耀
江浩斌
田宁
米伟
王春宏
机构
江苏大学
江苏罡阳转向系统有限公司
出处
《交通运输系统工程与信息》
EI
CSCD
北大核心
2024年第2期105-113,187,共10页
基金
国家自然科学基金(52225212)
江苏省六大人才高峰项目(2019-GDZB-084)
泰州市科技支撑计划项目(TG202307)。
文摘
为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与基于规则的决策规划方法相结合设计自动驾驶决策规划协同智能体。结合自注意力机制(Self Attention Mechanism, SAM)和门控循环单元(Gate Recurrent Unit, GRU)构建预处理网络;根据规划模块的具体实现方式设计动作空间;运用信息反馈思想设计奖励函数,给智能体添加车辆行驶条件约束,并将轨迹信息传递给决策模块,实现决策规划的信息协同。在CARLA自动驾驶仿真平台中搭建交通场景对智能体进行训练,并在不同场景中将所提出的决策规划协同方法与常规的基于SAC算法的决策规划方法进行比较,结果表明,本文所设计的自动驾驶决策规划协同智能体学习速度提高了25.10%,由其决策结果生成的平均车速更高,车速变化率更小,更接近道路期望车速,路径长度与曲率变化率更小。
关键词
智能交通
自动驾驶
柔性
演员
-
评论家
算法
决策规划协同
深度强化学习
Keywords
intelligent transportation
autonomous driving
soft actor-critic algorithm
collaborative decision and planning
deep reinforcement learning
分类号
U491 [交通运输工程—交通运输规划与管理]
在线阅读
下载PDF
职称材料
题名
基于改进强化学习的移动机器人动态避障方法
被引量:
8
2
作者
徐建华
邵康康
王佳惠
刘学聪
机构
北京理工大学自动化学院
出处
《中国惯性技术学报》
EI
CSCD
北大核心
2023年第1期92-99,共8页
基金
装备重大基础研究项目(5140502A03)。
文摘
针对未知环境下移动机器人动态避障存在规划轨迹长、行驶速度慢和鲁棒性差等问题,提出一种基于改进强化学习的移动机器人动态避障方法。移动机器人根据自身速度、目标位置和激光雷达信息直接得到动作信号,实现端到端的控制。基于距离梯度引导和角度梯度引导促使移动机器人向终点方向优化,加快算法的收敛速度;结合卷积神经网络从多维观测数据中提取高质量特征,提升策略训练效果。仿真试验结果表明,在多动态障碍物环境下,所提方法的训练速度提升40%、轨迹长度缩短2.69%以上、平均线速度增加11.87%以上,与现有主流避障方法相比,具有规划轨迹短、行驶速度快、性能稳定等优点,能够实现移动机器人在多障碍物环境下平稳避障。
关键词
移动机器人
动态避障
强化学习
柔性演员评论家算法
卷积神经网络
Keywords
mobile robot
dynamic obstacle avoidance
reinforcement learning
soft actor-critic
convolutional neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
考虑进站策略的网联电动公交车节能驾驶优化研究
3
作者
南斯睿
于谦
李铁柱
尚赞娣
陈海波
机构
西安建筑科技大学
出处
《交通运输系统工程与信息》
2025年第2期82-94,共13页
基金
陕西省教育厅科学研究计划项目
西安建筑科技大学新型城镇化专项研究基金项目
综合交通运输大数据应用技术交通运输行业重点实验室开放课题。
文摘
针对公交车在进出站和信号交叉口高能耗的问题,本文提出一种考虑进站策略的节能驾驶优化方法。首先,基于利用城市交通能力仿真(Simulation of Urban Mobility, SUMO)平台搭建智能网联场景,构建能够反映能耗、行驶效率和安全性的强化学习复合奖励函数;其次,将进站策略和预设交通规则作为约束集成于柔性演员-评论家(Soft Actor-Critic, SAC)深度强化学习框架中,优化车辆进出站及接近信号交叉口的轨迹;最后,以实际行驶、基于深度Q网络(Deep Q-Network, DQN)算法常规、基于SAC算法、基于规则约束和DQN算法(DQN-ruled)的优化方法作为基准方案,与本文提出的基于规则约束和SAC算法(SAC-ruled)的优化方法进行对比。结果表明:通过SAC-ruled算法优化后的驾驶轨迹在多种场景下均优于基准方案。在跟驰运动中,与基准方案相比,所设计的节能驾驶优化方法较基准方案的车辆能耗最高减少35.97%,行驶时间提升21.67%;在换道运动中,车辆能耗最多可降低41.40%,行驶时间提升16.94%。此外,通过敏感性分析验证,本文提出的基于SAC-ruled算法的节能驾驶优化方法在应对车流量波动方面表现出更强的适应性。本文建立的节能驾驶优化模型可集成节能辅助驾驶系统,鼓励驾驶员主动节能。
关键词
智能交通
节能驾驶优化
深度强化学习
纯电动公交
柔性
演员
-
评论家
算法
Keywords
intelligent transportation
energy-saving driving optimization
deep reinforcement learning
electric bus
soft actor-critic algorithm
分类号
U495 [交通运输工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于柔性演员-评论家算法的决策规划协同研究
唐斌
刘光耀
江浩斌
田宁
米伟
王春宏
《交通运输系统工程与信息》
EI
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
2
基于改进强化学习的移动机器人动态避障方法
徐建华
邵康康
王佳惠
刘学聪
《中国惯性技术学报》
EI
CSCD
北大核心
2023
8
在线阅读
下载PDF
职称材料
3
考虑进站策略的网联电动公交车节能驾驶优化研究
南斯睿
于谦
李铁柱
尚赞娣
陈海波
《交通运输系统工程与信息》
2025
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部