-
题名求解外卖配送问题的深度强化学习算法
- 1
-
-
作者
张旭阳
刘勇
马良
-
机构
上海理工大学管理学院
-
出处
《计算机应用研究》
北大核心
2025年第1期205-213,共9页
-
基金
教育部人文社会科学研究青年基金资助项目(21YJC630087)。
-
文摘
以最小化骑手费用效益比为优化目标,采用最小比率旅行商问题对外卖配送问题进行建模。针对目前算法在求解该问题时计算精度低、算法稳定性差等问题,设计一种基于深度强化学习的DRL-MFA算法。首先,定义外卖配送问题的马尔可夫决策模型来模拟智能体与环境的交互过程;其次,在编码阶段设计多特征聚合嵌入子层,实现特征间的优势互补并提高模型对非线性问题的建模能力;最后,在解码阶段通过注意力机制和指针网络计算解的概率分布,采用策略梯度算法对网络模型进行训练。通过经典算例和长春市仿真案例的相关实验分析,结果表明该算法能够有效地求解外卖配送问题,且与其他启发式算法相比,具有更高的稳定性和求解精度。此外,进行参数灵敏度实验,考虑不同定价策略对外卖配送的影响,使研究结果更具现实意义。
-
关键词
外卖配送问题
最小比率旅行商问题
深度强化学习
多特征嵌入
注意力机制
-
Keywords
takeout delivery
minimum ratio traveling salesman problem
deep reinforcement learning
multi-feature embedding
attention mechanism
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-