-
题名基于分层强化学习的在线三维装箱模型
- 1
-
-
作者
亓明凯
王迪
张立晔
-
机构
山东理工大学计算机科学与技术学院
-
出处
《计算机工程》
北大核心
2025年第6期136-145,共10页
-
基金
山东省自然科学基金(ZR2023MF015)。
-
文摘
在过去的一些研究中,人工智能如何以一种分层的方式在多个抽象级别和多个时间尺度上表示感知和行动规划逐渐成为一个研究热点。受限于技术手段,多数工作都局限在人工分解任务阶段,如在三维装箱问题(3D-BPP)中,通过启发式规则指导神经网络解析打包点帮助智能体分解状态空间,将原本庞大、复杂的空间转换为一个个子空间,为神经网络提供更好的备选解决方案。然而这种方式受限于规则本身,若规则不能完美地拆解问题,则这种固定规则的辅助会限制神经网络的性能,使得更好的解决方案被规则本身忽略。针对这种情况,提出一种基于启发式规则融合策略的改进装箱配置树(PCT)模型,通过分层强化学习的思想将问题分层,引入图注意力分类模型来判断在当前情况下最优的空间点拓展方案,由此为拆解箱体内部空间点与探寻可行性位置提供更多的排列组合方式。实验结果表明,基于启发式规则融合策略的改进模型在多个数据集上表现优于原始模型,在包含额外密度信息的数据集中平均装箱利用率高达77.2%,较原始模型提升1.7百分点,能够在合理的时间内给出性能更优的解决方案。
-
关键词
分层强化学习
三维装箱
图注意力网络
启发式空间拓展
深度强化学习
-
Keywords
hierarchical reinforcement learning
3D bin packing
Graph Attention Network(GAT)
heuristic space expansion
deep reinforcement learning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-