随机需求车辆路径问题的价值逼近在线决策被引量：4

Value-approximation-based online policy for vehicle routing problem with stochastic demand

在线阅读下载PDF

导出

摘要随着高效实时物流的发展,不确定车辆路径问题面临着兼顾决策精度和实时响应能力的新挑战.本文以应用最为广泛的随机需求车辆路径问题为例,研究提出一种有效的在线决策方法.首先,考虑多车辆同时在线,以总旅行成本最小化为目标,建立马尔科夫决策模型,并引入可信度约束和邻域半径减少策略缩小行动空间,提高求解效率.其次,设计强化学习中的价值逼近算法求解模型,其中,采用基函数估计期望未来成本,并将求解过程分离为离线训练和在线决策两个环节,基函数的权重被离线训练并用于在线决策以减少在线决策时间,同时,在算法中嵌入了邻域半径的动态更新机制.最后,测试多组算例验证了本文方法的有效性. With the development of effective real-time logistic, new challenges of making high-quality and real-time dynamic routing decisions have been brought to uncertain vehicle routing problem(VRP). This paper focuses on the vehicle routing problem with stochastic demand(VRPSD), a well-known uncertain VRP, and proposes an effective online method for solving it. First, considering multiple vehicles, we formulate a multi-vehicle Markov decision process(M-MDP), with the aim of minimizing the total travel cost. In the model, the credibility constraints and the neighborhood radius reduction strategy are introduced to reduce action space, which improves the efficiency. Second, we develop a reinforcement learning technology, namely value approximation iteration including offline training phase and online execution phase, to solve the model. In the method, the expected cost-to-go is estimated by a set of basis functions designed, the weight vector of basis function is trained offline to reduce online calculation time, and also, the value of neighborhood radius is dynamically updated offline. Numerical experiments show that the proposed method has good performance in both solution quality and time efficiency.

作者张晓楠张建雄 ZHANG Xiao-nan;ZHANG Jian-xiong(College of Management and Economics,Tianjin University,Tianjin 300072,China;College of Mechanical and Electrical Engineering,Shaanxi University of Science and Technology,Xi’an Shaanxi,710021,China)

机构地区天津大学管理与经济学部陕西科技大学机电工程学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2022年第2期241-254,共14页 Control Theory & Applications

基金国家自然科学基金项目(71802120,71971152) 陕西省创新能力支撑计划(2020KRM024) 陕西省教育厅专项科研计划项目(19JK0125)资助。

关键词路径问题随机需求马尔可夫决策强化学习价值逼近算法 routing problems stochastic demand Markov decision process reinforcement learning value approximation iteration

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] U492.22 [交通运输工程—交通运输规划与管理]

作者简介张晓楠讲师,博士,目前研究方向为物流系统优化和智能优化算法,E-mail:WLxn_2010@126.com;通信作者:张建雄,教授,博士,博士生导师,决策科学领域中国高被引学者,目前研究方向为动态供应链管理、复杂系统建模与优化,E-mail:jxzhang@tju.edu.cn.

引文网络
相关文献

参考文献15

1庞燕,罗华丽,邢立宁,任腾.车辆路径优化问题及求解方法研究综述[J].控制理论与应用,2019,36(10):1573-1584. 被引量：66
2葛显龙,李祖伟,葛小波.考虑灵活充电策略的带时间窗物流配送路径优化研究[J].控制理论与应用,2020,37(6):1293-1301. 被引量：27
3武楚雄,陈驰,张贵军.动态路网选址–路径优化算法及实现[J].控制理论与应用,2020,37(11):2398-2412. 被引量：4
4李妍峰,高自友,李军.基于实时交通信息的城市动态网络车辆路径优化问题[J].系统工程理论与实践,2013,33(7):1813-1819. 被引量：59
5宁涛,王旭坪,胡祥培.行驶受扰延迟下配送车辆调度的干扰管理决策模型[J].系统工程理论与实践,2019,39(5):1236-1245. 被引量：16
6范厚明,李荡,孔靓,任晓雪.模糊需求下时间依赖型车辆路径优化[J].控制理论与应用,2020,37(5):950-960. 被引量：16
7杨华龙,赵亮,靳莉哲,王征.基于汇集预测的随机客户需求配送车辆调度问题[J].系统管理学报,2019,28(5):917-926. 被引量：10
8曹二保,赖明勇,李董辉.基于混合差分进化算法的模糊需求车辆路径问题[J].系统工程理论与实践,2009,29(2):106-113. 被引量：21
9范厚明,刘浩,刘鹏程,任晓雪.集货需求模糊的异型车同时配集货路径优化[J].控制理论与应用,2021,38(5):661-675. 被引量：9
10王征,胡祥培,王旭坪.行驶时间延迟下配送车辆调度的干扰管理模型与算法[J].系统工程理论与实践,2013,33(2):378-387. 被引量：31

二级参考文献223

1曹二保,赖明勇,李董辉.基于混合差分进化算法的模糊需求车辆路径问题[J].系统工程理论与实践,2009,29(2):106-113. 被引量：21
2赵燕伟,彭典军,张景玲,吴斌.有能力约束车辆路径问题的量子进化算法[J].系统工程理论与实践,2009,29(2):159-166. 被引量：41
3张军,唐加福,潘震东,孔媛.分散搜索算法求解带货物权重的车辆路径问题[J].系统工程学报,2010,25(1):91-97. 被引量：11
4董红宇,黄敏,王兴伟,郑秉霖.变邻域搜索算法综述[J].控制工程,2009,16(S2):1-5. 被引量：21
5宁涛,郭晨,陈荣,金花.一种动态车辆路径问题解决策略仿真研究[J].系统仿真学报,2015,27(12):2942-2947. 被引量：5
6谢涛,陈火旺,康立山.二次背包问题的一种快速解法[J].计算机学报,2004,27(9):1162-1169. 被引量：4
7张建勇,李军.模糊车辆路径问题的一种混合遗传算法[J].管理工程学报,2005,19(2):23-26. 被引量：22
8郎茂祥.装卸混合车辆路径问题的模拟退火算法研究[J].系统工程学报,2005,20(5):485-491. 被引量：51
9王明春,高成修,曾永廷.VRPTW的扰动恢复及其TABUSEARCH算法[J].数学杂志,2006,26(2):231-236. 被引量：24
10柯良军,冯祖仁,冯远静.有限级信息素蚁群算法[J].自动化学报,2006,32(2):296-303. 被引量：17

共引文献303

1徐稳.动态路网下物流配送中心选址-路径优化算法及实现分析[J].运输经理世界,2021(33):67-69.
2牛锴文,初良勇,闫淼,初祺涵,许小卫.考虑拥堵因素的配送车辆路径优化模型与算法研究[J].物流研究,2022(3):75-85. 被引量：1
3方俊豪,李俊玲.基于遗传算法的某物流公司配送路径优化设计[J].城市建设理论研究（电子版）,2022(33):151-153.
4王林,贺靖,陈璨,曾宇容.资金约束下基于自适应差分进化算法的联合采购模型及其应用[J].系统工程,2010,28(9):63-68. 被引量：3
5杨文超,王征.时间因素扰动下物流配送干扰管理问题的启发式算法[J].工业工程,2011,14(4):39-45. 被引量：2
6巩固,白晓光,熊利泽,龚辉.氯胺酮伍用安定抑制犬缺氧性肺血管收缩[J].第四军医大学学报,2000,21(2):196-197. 被引量：2
7周健,李燕,惠延年,马吉献.波形纤维蛋白转基因小鼠白内障的形态学观察[J].第四军医大学学报,2000,21(2):200-203. 被引量：4
8焦斌,林蔚天.H桥型IGBT直供成套电源[J].上海工程技术大学学报,2000,14(1):45-49.
9吴永刚,陈玲燕,张哲,乔轶,魏军明,秦树基.X射线激光Nd,Dy,Er和Yb薄膜靶表面氧化过程的石英晶振方法研究[J].真空科学与技术,2000,20(3):214-218.
10李俊州.基于并行协同演化的差分进化算法[J].科学技术与工程,2012,20(34):9211-9214.

同被引文献43

1张涛,余绰娅,刘岚,邵志芳,张玥杰.同时送取货的随机旅行时间车辆路径问题方法[J].系统工程理论与实践,2011,31(10):1912-1920. 被引量：15
2艾云飞,吕靖,张丽丽.三角模糊需求下水上应急储备库选址-分配优化模型[J].安全与环境学报,2016,16(2):179-183. 被引量：5
3李阳,范厚明,张晓楠,杨翔.求解模糊需求车辆路径问题的两阶段变邻域禁忌搜索算法[J].系统工程理论与实践,2018,38(2):522-531. 被引量：37
4李阳,范厚明,张晓楠,杨翔.随机需求车辆路径问题及混合变邻域分散搜索算法求解[J].控制理论与应用,2017,34(12):1594-1604. 被引量：20
5何尧,刘建华,杨荣华.人工蜂群算法研究综述[J].计算机应用研究,2018,35(5):1281-1286. 被引量：61
6尚庆学,李吉超,王涛.医疗系统抗震韧性评估指标体系[J].工程力学,2019,36(B06):106-110. 被引量：29
7刘扬,张国富,苏兆品,蒋建国.救灾物资多阶段分配与调度问题建模与求解[J].控制与决策,2019,34(9):2015-2022. 被引量：20
8杨俊闯,赵超.K-Means聚类算法研究综述[J].计算机工程与应用,2019,55(23):7-14. 被引量：346
9靳志宏,鞠新诚,郭加佳,杨珍花.O2O模式下外卖骑手的配送路径优化[J].大连海事大学学报,2019,45(4):55-64. 被引量：14
10赵向南,邢磊,靳志宏.考虑不确定行驶时间的双目标外卖配送路径优化[J].大连海事大学学报,2019,45(4):65-72. 被引量：4

引证文献4

1李智楠,刘勤明,陆昊洋.韧性视角下基于随机演变的城市应急医疗物资配置模型[J].计算机应用,2023,43(3):978-985. 被引量：2
2周开军,刘婷,周鲜成,陈荣元,汪倩.考虑随机需求的带时间窗绿色车辆路径模型及优化算法研究[J].系统科学与数学,2023,43(10):2557-2572. 被引量：5
3师泽宇,陈阳舟,安树科.基于交通预测信息的电动汽车充电路径规划[J].北京工业大学学报,2024,50(8):974-984.
4张晓楠,张建雄,李相芊.动态随机餐食外卖配送在线决策模型与算法[J].系统工程理论与实践,2025,45(1):269-289.

二级引证文献7

1缑迅杰,赵芸莹,徐鑫茹,徐泽水.应急医疗物资配置研究现状及可视化分析[J].四川大学学报（自然科学版）,2023,60(6):13-25. 被引量：5
2王姣姣,王小莉,王立贵,王全意,曹志冬,曾大军.传染病患者就医行为预测与优化建模研究综述[J].国际病毒学杂志,2023,30(6):524-528.
3刘翱.变邻域搜索分布估计算法求解舰载机保障作业调度问题[J].系统科学与数学,2024,44(2):391-407.
4周鲜成,余玮瑛,李松明,周开军,吕阳.考虑时间依赖和同时取送货的双目标绿色车辆路径问题研究[J].系统科学与数学,2024,44(9):2798-2815. 被引量：3
5Jia Zhang,Zexuan Jin,Qichen Dong.Multi-Agent Collaborative Task Planning with Uncertain Task Requirements[J].Journal of Beijing Institute of Technology,2024,33(5):361-373.
6靳国伟,任维权,王文杰,严明,陈希,赵伊楠.车辆运输能力随机的应急物流选址-分配-路径优化[J].铁路物流,2025,43(1):25-33. 被引量：1
7肖强,施伟,郑云健,张园园.碳排放成本下带时间窗的多车型物流配送路径优化[J].供应链管理,2025,6(5):30-43.

1范铁桥.冷链物流车辆路径问题研究综述[J].中国储运,2022(3):125-126. 被引量：1
2马军,张平东.供应链网络均衡模型综述与展望[J].经济论坛,2022(2):76-83. 被引量：2
3刘俣豪,刘树人,雷俊林,罗岸华.供应不可靠下的库存定价联合决策研究[J].湘潭大学学报（自然科学版）,2021,43(6):1-12. 被引量：1
4杨子沫,阿媛,仲昭林.随机需求条件下低碳闭环供应链网络优化研究[J].商业观察,2022(8):69-74.
5李爽,肖伟,董志诚,周维曦.高速移动场景下的多用户OFDM系统功率分配[J].长江信息通信,2021,34(12):46-49. 被引量：2
6李永飞,魏松波,董焕焕.随机需求和收益共享契约约束下的供应链协调问题研究[J].统计与决策,2022,38(1):179-183. 被引量：11
7陈治亚,高辉,徐光明,刘吉华.考虑随机需求和硬时间窗的多目标车辆路径优化方法[J].铁道科学与工程学报,2021,18(12):3110-3120. 被引量：17
8郭天昊,张钢,岳文渊,王倩,郭大波.基于多智能体强化学习的无人机群室内辅助救援[J].计算机系统应用,2022,31(2):88-95. 被引量：2
9徐振国,刘志,党同桐,孔玺.教育智能体的发展历程、应用现状与未来展望[J].电化教育研究,2021,42(11):20-26. 被引量：44
10李宝帅,叶春明.深度强化学习算法求解作业车间调度问题[J].计算机工程与应用,2021,57(23):248-254. 被引量：9

控制理论与应用

2022年第2期

浏览历史

内容加载中请稍等...

随机需求车辆路径问题的价值逼近在线决策被引量：4

参考文献15

二级参考文献223

共引文献303

同被引文献43

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

随机需求车辆路径问题的价值逼近在线决策 被引量：4

参考文献15

二级参考文献223

共引文献303

同被引文献43

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

随机需求车辆路径问题的价值逼近在线决策被引量：4