-
题名基于强化学习-蒙特卡洛树搜索的铁路线路优化
- 1
-
-
作者
王光辉
蒲浩
宋陶然
李伟
张洪
胡光常
-
机构
高速铁路建造技术国家工程研究中心
中国中铁股份有限公司
中南大学土木工程学院
华东交通大学铁路环境振动与噪声教育部工程研究中心
中铁二院工程集团有限责任公司
-
出处
《铁道学报》
北大核心
2025年第5期102-110,共9页
-
基金
国家自然科学基金(52078497)
国家重点研发计划(2021YFB2600403)
中国中铁股份有限公司科技研究开发计划(2022-重大-20)。
-
文摘
铁路线路智能搜索方法是实现高效线路优化的关键。现有铁路线路优化方法强于局部计算,缺乏对后续未知及全局态势的感知能力,导致线路智能搜索算法出现“智能”不智的现象。为解决上述问题,提出一种用于铁路线路优化的强化学习-蒙特卡洛树搜索(RL-MCTS)融合方法,构建一种蒙特卡洛树搜索线路优化框架,提出先广度优先-后深度优先的选择方法以权衡线路的全局与局部利益;为准确评估线路的全局利益,定制一种强化学习模拟方法,为RL-MCTS提供线路优化的大局观。将该方法应用于实际的铁路案例,相较于人工方案,RL-MCTS生成的优化线路方案工程造价降低8.2%,验证了本文提出方法的有效性。
-
关键词
铁路线路优化
强化学习
蒙特卡洛树搜索
时变选择方法
全局奖励评估
-
Keywords
railway alignment optimization
reinforcement learning
Monte Carlo tree search
time-varying selection approach
global reward estimation
-
分类号
U212.3
[交通运输工程—道路与铁道工程]
-