期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
随机需求车辆路径问题的价值逼近在线决策
被引量:
4
1
作者
张晓楠
张建雄
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022年第2期241-254,共14页
随着高效实时物流的发展,不确定车辆路径问题面临着兼顾决策精度和实时响应能力的新挑战.本文以应用最为广泛的随机需求车辆路径问题为例,研究提出一种有效的在线决策方法.首先,考虑多车辆同时在线,以总旅行成本最小化为目标,建立马尔...
随着高效实时物流的发展,不确定车辆路径问题面临着兼顾决策精度和实时响应能力的新挑战.本文以应用最为广泛的随机需求车辆路径问题为例,研究提出一种有效的在线决策方法.首先,考虑多车辆同时在线,以总旅行成本最小化为目标,建立马尔科夫决策模型,并引入可信度约束和邻域半径减少策略缩小行动空间,提高求解效率.其次,设计强化学习中的价值逼近算法求解模型,其中,采用基函数估计期望未来成本,并将求解过程分离为离线训练和在线决策两个环节,基函数的权重被离线训练并用于在线决策以减少在线决策时间,同时,在算法中嵌入了邻域半径的动态更新机制.最后,测试多组算例验证了本文方法的有效性.
展开更多
关键词
路径问题
随机需求
马尔可夫决策
强化学习
价值逼近算法
在线阅读
下载PDF
职称材料
题名
随机需求车辆路径问题的价值逼近在线决策
被引量:
4
1
作者
张晓楠
张建雄
机构
天津大学管理与经济学部
陕西科技大学机电工程学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022年第2期241-254,共14页
基金
国家自然科学基金项目(71802120,71971152)
陕西省创新能力支撑计划(2020KRM024)
陕西省教育厅专项科研计划项目(19JK0125)资助。
文摘
随着高效实时物流的发展,不确定车辆路径问题面临着兼顾决策精度和实时响应能力的新挑战.本文以应用最为广泛的随机需求车辆路径问题为例,研究提出一种有效的在线决策方法.首先,考虑多车辆同时在线,以总旅行成本最小化为目标,建立马尔科夫决策模型,并引入可信度约束和邻域半径减少策略缩小行动空间,提高求解效率.其次,设计强化学习中的价值逼近算法求解模型,其中,采用基函数估计期望未来成本,并将求解过程分离为离线训练和在线决策两个环节,基函数的权重被离线训练并用于在线决策以减少在线决策时间,同时,在算法中嵌入了邻域半径的动态更新机制.最后,测试多组算例验证了本文方法的有效性.
关键词
路径问题
随机需求
马尔可夫决策
强化学习
价值逼近算法
Keywords
routing problems
stochastic demand
Markov decision process
reinforcement learning
value approximation iteration
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
U492.22 [交通运输工程—交通运输规划与管理]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
随机需求车辆路径问题的价值逼近在线决策
张晓楠
张建雄
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022
4
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部