针对紧急插单事件的动态作业车间调度问题,以最小化所有工件的提前与延迟完工时间为目标,创建了动态作业车间环境模型。将调度问题转换为马尔可夫过程,并采用结合图神经网络的DDQN(double deep Q-network,DDQN)深度强化学习算法进行求...针对紧急插单事件的动态作业车间调度问题,以最小化所有工件的提前与延迟完工时间为目标,创建了动态作业车间环境模型。将调度问题转换为马尔可夫过程,并采用结合图神经网络的DDQN(double deep Q-network,DDQN)深度强化学习算法进行求解。通过图神经网络对车间状态析取图做特征提取从而避免状态定义依赖人工经验设计的问题,引入了注意力机制能够增强强化学习智能体对状态信息的获取能力,并将六组规则调度作为智能体的决策空间,定义了全新的奖励方法,加强其对智能体学习的指导能力。通过多组对照实验说明了所构建的求解模型的有效性和可行性。展开更多
文摘针对紧急插单事件的动态作业车间调度问题,以最小化所有工件的提前与延迟完工时间为目标,创建了动态作业车间环境模型。将调度问题转换为马尔可夫过程,并采用结合图神经网络的DDQN(double deep Q-network,DDQN)深度强化学习算法进行求解。通过图神经网络对车间状态析取图做特征提取从而避免状态定义依赖人工经验设计的问题,引入了注意力机制能够增强强化学习智能体对状态信息的获取能力,并将六组规则调度作为智能体的决策空间,定义了全新的奖励方法,加强其对智能体学习的指导能力。通过多组对照实验说明了所构建的求解模型的有效性和可行性。