-
题名基于深度强化学习算法的弹性供应链调度优化方法
被引量:1
- 1
-
-
作者
张进军
-
机构
安徽警官职业学院信息管理系
-
出处
《信息技术与信息化》
2024年第4期89-92,共4页
-
基金
2023年度安徽省高校自然科学研究重大项目“基于元知识的弹性供应链优化模型的设计”(2023AH040354)。
-
文摘
由于参与供应链的客户需求和供应者配置的多元性,导致供应链的配送成本难以得到有效控制,主要是因为在模型求解过程中,受困于参数本身的矛盾性,求解过程很容易陷入局部最优。为此,提出基于深度强化学习算法的弹性供应链调度优化方法研究。分别从供应者配置角度和客户需求角度构建了供应链模型,以供应链配送成本最小化为目标函数,应用深度强化学习算法中的深度Q网络(deepQ-network,DQN)算法进行训练,同步进行弹性供应链优化调度。DQN能够有效地处理这种高维状态空间,通过深度神经网络学习状态与动作之间的映射关系,自动提取关键特征,从而简化问题的复杂性。将收敛输出结果期望误差,输入供应链模型进行迭代计算,输出优化调度结果。测试结果表明,设计的方法可以实现对配送成本的有效控制。
-
关键词
深度强化学习算法
弹性供应链调度
供应者配置
客户需求
供应链模型
配送成本最小化
DeepQ-Network
误差收敛
-
分类号
F274
[经济管理—企业管理]
TP18
[自动化与计算机技术—控制理论与控制工程]
-