期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习-蒙特卡洛树搜索的铁路线路优化
1
作者 王光辉 蒲浩 +3 位作者 宋陶然 李伟 张洪 胡光常 《铁道学报》 北大核心 2025年第5期102-110,共9页
铁路线路智能搜索方法是实现高效线路优化的关键。现有铁路线路优化方法强于局部计算,缺乏对后续未知及全局态势的感知能力,导致线路智能搜索算法出现“智能”不智的现象。为解决上述问题,提出一种用于铁路线路优化的强化学习-蒙特卡洛... 铁路线路智能搜索方法是实现高效线路优化的关键。现有铁路线路优化方法强于局部计算,缺乏对后续未知及全局态势的感知能力,导致线路智能搜索算法出现“智能”不智的现象。为解决上述问题,提出一种用于铁路线路优化的强化学习-蒙特卡洛树搜索(RL-MCTS)融合方法,构建一种蒙特卡洛树搜索线路优化框架,提出先广度优先-后深度优先的选择方法以权衡线路的全局与局部利益;为准确评估线路的全局利益,定制一种强化学习模拟方法,为RL-MCTS提供线路优化的大局观。将该方法应用于实际的铁路案例,相较于人工方案,RL-MCTS生成的优化线路方案工程造价降低8.2%,验证了本文提出方法的有效性。 展开更多
关键词 铁路线路优化 强化学习 蒙特卡洛树搜索 时变选择方法 全局奖励评估
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部