-
题名协同智能体强化学习算法的柔性作业车间调度方法研究
被引量:2
- 1
-
-
作者
李健
李洹坤
何鹏博
王化北
徐莉萍
何奎
-
机构
河南科技大学机电工程学院
机械装备先进制造河南省协同创新中心
-
出处
《系统仿真学报》
CAS
CSCD
北大核心
2024年第11期2699-2711,共13页
-
基金
国家重点研发计划(2018YFB1701205)
河南省科技攻关项目(212102210356)。
-
文摘
为提高柔性作业车间调度效率,构建一种具有柔性作业车间调度问题约束条件的马尔可夫决策过程,针对工件与机器的同时选择问题,提出一种协同智能体强化学习方法进行求解。在构建马尔可夫决策过程中,引入析取图表述状态特征,采用两种智能体执行工件与机器的选取,预测不同时刻最小化最大完工时间的差值来映射整个调度过程的奖励参数;求解时,嵌入GIN(graph isomorphic network)图神经网络提取状态,为工件与机器智能体分别设置编码器-解码器构件输出两种动作策略,以PPO(proximal policy optimization)算法与D3QN算法训练工件与机器智能体的决策网络参数。通过正交试验法选取算法超参数,以标准实例与其他文献进行对比,实验结果表明,所提方法在求解FJSP方面明显优于其他算法,进一步验证所提方法的可行性与有效性。
-
关键词
柔性作业车间调度问题
图神经网络
马尔可夫决策过程
协同智能体强化学习
正交试验法
-
Keywords
flexible job shop scheduling problem
graph neural network(GNN)
Markov decision process
collaborative agent reinforcement learning
orthogonal experiment method
-
分类号
TP278
[自动化与计算机技术—检测技术与自动化装置]
-