期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
依托周期性重训练强化学习的矿卡车道保持算法
1
作者 刘锦瑶 谢丽蓉 +3 位作者 卞一帆 安毅 杨志勇 黄德启 《金属矿山》 2025年第10期175-181,共7页
为解决自动驾驶矿用卡车在矿山复杂环境下易失去对先前策略适应能力的难题,提出了一种考虑样本重训练的深度强化学习车道保持控制算法。首先,通过考虑目标网络更新参数的特性,推导出一种周期性经验抽取重训练模型,将重训练回合间隔纳入... 为解决自动驾驶矿用卡车在矿山复杂环境下易失去对先前策略适应能力的难题,提出了一种考虑样本重训练的深度强化学习车道保持控制算法。首先,通过考虑目标网络更新参数的特性,推导出一种周期性经验抽取重训练模型,将重训练回合间隔纳入到传统目标网络更新参数模型中。然后,为避免噪声对模型的影响,将经验回放缓冲区设置在较小的抽样范围内,噪声和不相关的经验对模型的影响会被降低,增强极端运行条件下的系统鲁棒性。最后,考虑到露天矿山典型十字形道路,在CARLA中设定车辆位置于十字路口,采用固定回合数下得到的平均奖励作为模拟的关键性能指标进行仿真试验。试验结果表明,提出的周期性重训练深度Q网络(PR-DQN)策略有效减少了训练过程中的波动,使模型更快收敛,有效提升模型在非平稳环境任务中的性能,在稳定性和泛化能力上表现出显著优势。 展开更多
关键词 自动驾驶 深度强化学习 矿用卡车 车道保持 周期性重训练
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部