期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
协同智能体强化学习算法的柔性作业车间调度方法研究 被引量:2
1
作者 李健 李洹坤 +3 位作者 何鹏博 王化北 徐莉萍 何奎 《系统仿真学报》 CAS CSCD 北大核心 2024年第11期2699-2711,共13页
为提高柔性作业车间调度效率,构建一种具有柔性作业车间调度问题约束条件的马尔可夫决策过程,针对工件与机器的同时选择问题,提出一种协同智能体强化学习方法进行求解。在构建马尔可夫决策过程中,引入析取图表述状态特征,采用两种智能... 为提高柔性作业车间调度效率,构建一种具有柔性作业车间调度问题约束条件的马尔可夫决策过程,针对工件与机器的同时选择问题,提出一种协同智能体强化学习方法进行求解。在构建马尔可夫决策过程中,引入析取图表述状态特征,采用两种智能体执行工件与机器的选取,预测不同时刻最小化最大完工时间的差值来映射整个调度过程的奖励参数;求解时,嵌入GIN(graph isomorphic network)图神经网络提取状态,为工件与机器智能体分别设置编码器-解码器构件输出两种动作策略,以PPO(proximal policy optimization)算法与D3QN算法训练工件与机器智能体的决策网络参数。通过正交试验法选取算法超参数,以标准实例与其他文献进行对比,实验结果表明,所提方法在求解FJSP方面明显优于其他算法,进一步验证所提方法的可行性与有效性。 展开更多
关键词 柔性作业车间调度问题 图神经网络 马尔可夫决策过程 协同智能体强化学习 正交试验法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部