-
题名求解在线三维装箱问题的启发式深度强化学习算法
- 1
-
-
作者
张长勇
姚凯超
张宇浩
-
机构
中国民航大学电子信息与自动化学院
-
出处
《计算机工程与应用》
北大核心
2025年第17期329-336,共8页
-
基金
中央高校高水平培育项目(3122023PY04)。
-
文摘
货物装载是物流运输过程中的关键一环,属于NP-Hard问题。为解决智慧物流领域货物“即到即码”的实时性问题,提出了一种候选启发式与深度强化学习相结合的在线三维装箱算法。将在线三维装箱表述为带约束的马尔科夫决策过程,并考虑七种实际约束条件,在此基础上设计强化学习要素。设置货物码垛的候选缓存区,根据人工启发式生成有价值的先验知识,以此来初始化深度强化学习算法的训练过程,最终经过对决网络评估后输出最优动作。实验结果表明,算法空间利用率为85.3%,收敛速度提高25%,决策时间平均快15 ms,有效解决了面对大规模动作空间增长导致的智能体初期探索困难的问题,提高了算法的效率和实用性,更适用于实际在线装箱场景。
-
关键词
NP-HARD问题
在线三维装箱
候选启发式
深度强化学习
马尔可夫决策
-
Keywords
NP-Hard problem
online 3D bin packing
candidate heuristic
deep reinforcement learning
Markov decision
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TB485.3
[一般工业技术—包装工程]
-
-
题名基于无监督深度融合机制的货物在线装箱算法
被引量:1
- 2
-
-
作者
张长勇
姚凯超
王彤
-
机构
中国民航大学电子信息与自动化学院
-
出处
《包装工程》
CAS
北大核心
2024年第11期153-162,共10页
-
基金
中央高校高水平培育项目(3122023PY04)。
-
文摘
目的针对当前三维装箱算法存在的模型鲁棒性差、泛化性弱、装载率低等问题,设计一种无监督融合机制的在线装箱算法。方法充分考虑货物“即到即码”的实时性需求,以容器空间利用率为优化目标,基于无监督深度融合指针网络端到端学习模型框架,将在线三维装箱的码垛过程公式化地表述为马尔科夫决策过程,设计强化学习要素,并以深度强化学习算法为主,融入蒙特卡洛树搜索,对智能体的决策动作进行训练,以生成具有较优“学习”能力的在线三维装箱模型。结果采用125种不同尺寸和方向随机生成货物数据集,并在7种约束条件下验证,实验结果表明,容器的平均利用率可达84.6%。结论该算法的泛化性较好,且其装载率远优于当前效果较好的启发式算法、深度学习方法,为货物的在线装箱提供了理论依据及参考。
-
关键词
在线三维装箱
无监督融合机制
马尔科夫决策
指针网络
蒙特卡洛树搜索
-
Keywords
online 3D packing
unsupervised integration mechanism
Markovian decision
pointer network
Monte Carlo tree search
-
分类号
TB485.3
[一般工业技术—包装工程]
-
-
题名基于启发式算法的在线多尺寸行李码放问题求解
被引量:2
- 3
-
-
作者
张威
柴生明
王伟
陈宇浩
-
机构
中国民航大学航空工程学院
-
出处
《包装工程》
CAS
北大核心
2021年第21期213-221,共9页
-
基金
国家自然科学基金委员会-中国民用航空局民航联合研究基金重点支持项目(U2033208)。
-
文摘
目的为了解决目前大部分三维装箱算法无法求解航空运输背景下机场托运行李在线码放的问题,开展在线托运行李码垛算法研究。方法首先,基于实际应用环境提出一种全新的码放顺序约束以及在线多尺寸行李码放数学模型。然后,设计一种有别于传统在线问题一次仅获取一件物品信息的规则,通过改变获取行李信息三维相机的位置,从而提前获取更多的行李信息,提出每次获取K个行李尺寸信息,并构建组合式码放策略的在线启发式“填充点”算法。最后,采用每次获取3件真实机场托运行李信息进行仿真和实验。结果结果证明,算法给出的码垛布局方案不仅可以确保在线状态下不同类型尺寸托运行李的高效码放,且优化后的算法可获得84.86%的填充率,同时具有良好码放稳定性。结论算法给出的码垛布局方案合理,有较好的填充率,为此后航空运输背景下在线三维装箱问题的算法设计提供了一个新方向。
-
关键词
航空运输
在线三维装箱
填充点
启发式算法
顺序约束
机场托运行李
-
Keywords
air transportation
online 3D boxing
packing point
heuristic algorithm
sequence constraint
airport checked luggage
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-