检索结果-维普期刊中文期刊服务平台

基于深度强化学习PPO的车辆智能控制方法: 1; 作者叶宝林王欣 +1 位作者李灵犀吴维敏《计算机工程》北大核心 2025年第7期385-396,共12页; 为提高高速公路上混合环境下车辆的行驶效率、减少交通事故的发生,提出一种基于近端策略优化(PPO)的车辆智能控制方法。首先构建一个融合深度强化学习和传统比例-积分-微分(PID)控制的分层控制框架,上层深度强化学习智能体负责确定控制... 展开更多; 关键词近端策略优化车辆控制分层控制框架多目标奖励函数深度Q网络; 在线阅读下载PDF 职称材料

基于深度强化学习的车辆自主避撞决策控制模型被引量：8: 2; 作者李文礼张友松 +2 位作者韩迪钱洪石晓辉《汽车安全与节能学报》 CAS CSCD 北大核心 2021年第2期201-209,共9页; 为提高车辆对行驶环境的自我学习和决策能力,提出了一种基于深度确定性策略梯度(DDPG)的车辆自主避撞决策控制模型。基于Markov决策过程的强化学习理论和车辆纵向运动学特性,设计了决策所需目标对象及自车信息的状态空间和自车减速度的... 展开更多; 关键词车辆安全自主避撞深度确定性策略梯度(DDPG) 控制模型多目标奖励函数; 在线阅读下载PDF 职称材料

融合强化学习和状态机的智能矿卡换道决策研究: 3; 作者程宇谢丽蓉 +3 位作者卞一帆杨志勇胡桂林闫壮《金属矿山》 2025年第10期191-200,共10页; 为提升露天煤矿智能网联矿卡的换道决策性能,提出了一种融合深度强化学习与有限状态机的换道决策方法。首先,构建了一个双层决策框架,上层利用深度Q网络生成初步换道决策,下层通过有限状态机进行安全性约束。其次,引入双重网络和竞争网... 展开更多; 关键词智能网联矿卡深度强化学习有限状态机换道决策多目标奖励函数; 在线阅读下载PDF 职称材料