期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
随机需求车辆路径问题的价值逼近在线决策 被引量:4
1
作者 张晓楠 张建雄 《控制理论与应用》 EI CAS CSCD 北大核心 2022年第2期241-254,共14页
随着高效实时物流的发展,不确定车辆路径问题面临着兼顾决策精度和实时响应能力的新挑战.本文以应用最为广泛的随机需求车辆路径问题为例,研究提出一种有效的在线决策方法.首先,考虑多车辆同时在线,以总旅行成本最小化为目标,建立马尔... 随着高效实时物流的发展,不确定车辆路径问题面临着兼顾决策精度和实时响应能力的新挑战.本文以应用最为广泛的随机需求车辆路径问题为例,研究提出一种有效的在线决策方法.首先,考虑多车辆同时在线,以总旅行成本最小化为目标,建立马尔科夫决策模型,并引入可信度约束和邻域半径减少策略缩小行动空间,提高求解效率.其次,设计强化学习中的价值逼近算法求解模型,其中,采用基函数估计期望未来成本,并将求解过程分离为离线训练和在线决策两个环节,基函数的权重被离线训练并用于在线决策以减少在线决策时间,同时,在算法中嵌入了邻域半径的动态更新机制.最后,测试多组算例验证了本文方法的有效性. 展开更多
关键词 路径问题 随机需求 马尔可夫决策 强化学习 价值逼近算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部