期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于强化学习的连续泊位岸桥联合调度优化研究
1
作者
邓涵毅
梁承姬
+2 位作者
SHI Jian
王钰
GINO LIM
《运筹与管理》
CSSCI
CSCD
北大核心
2024年第9期15-21,共7页
为了提高算法在大规模问题上的求解速度,提高集装箱码头的船舶周转速度。本文针对船舶泊位分配与岸桥调度都具有时序性,提出了一种包含状态、动作和奖励函数的马尔科夫决策过程的强化学习调度算法。在考虑泊位分配与岸桥数量调度问题的...
为了提高算法在大规模问题上的求解速度,提高集装箱码头的船舶周转速度。本文针对船舶泊位分配与岸桥调度都具有时序性,提出了一种包含状态、动作和奖励函数的马尔科夫决策过程的强化学习调度算法。在考虑泊位分配与岸桥数量调度问题的基础上,研究了同时决策泊位分配与岸桥调度,并考虑岸桥移动与具体岸桥编号分配的动态调度方法,建立了目标为船舶在港时间最短的连续泊位岸桥联合调度的数学模型。实验结果表明强化学习算法在大规模数据上求解速度明显比遗传算法和CPLEX快,解的质量也是相对优秀,证明了算法的有效性与优越性。为了改进该算法本文最后分析了强化学习算法的学习率、动作选择概率和折扣因子对结果的影响。
展开更多
关键词
集装箱港口
泊位与岸桥联合调度
马尔科夫决策过程
强化学习
在线阅读
下载PDF
职称材料
题名
基于强化学习的连续泊位岸桥联合调度优化研究
1
作者
邓涵毅
梁承姬
SHI Jian
王钰
GINO LIM
机构
上海海事
大学
物流科学与
工程
研究院
休斯敦大学
工程
技术
系
休斯敦大学工业工程系
出处
《运筹与管理》
CSSCI
CSCD
北大核心
2024年第9期15-21,共7页
基金
国家重点研发计划资助项目(2019YFB1704403)
国家自然科学基金资助项目(71972128)
上海市“科技创新行动计划”软科学研究项目(22692111200)。
文摘
为了提高算法在大规模问题上的求解速度,提高集装箱码头的船舶周转速度。本文针对船舶泊位分配与岸桥调度都具有时序性,提出了一种包含状态、动作和奖励函数的马尔科夫决策过程的强化学习调度算法。在考虑泊位分配与岸桥数量调度问题的基础上,研究了同时决策泊位分配与岸桥调度,并考虑岸桥移动与具体岸桥编号分配的动态调度方法,建立了目标为船舶在港时间最短的连续泊位岸桥联合调度的数学模型。实验结果表明强化学习算法在大规模数据上求解速度明显比遗传算法和CPLEX快,解的质量也是相对优秀,证明了算法的有效性与优越性。为了改进该算法本文最后分析了强化学习算法的学习率、动作选择概率和折扣因子对结果的影响。
关键词
集装箱港口
泊位与岸桥联合调度
马尔科夫决策过程
强化学习
Keywords
container port
berths combined with quay bridges
Markov decision process
reinforcement learning
分类号
U691.3 [交通运输工程—港口、海岸及近海工程]
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于强化学习的连续泊位岸桥联合调度优化研究
邓涵毅
梁承姬
SHI Jian
王钰
GINO LIM
《运筹与管理》
CSSCI
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部