-
题名深度强化学习引导的多种群协同进化超多目标优化算法
- 1
-
-
作者
许莹
刘佳
陈斌辉
刘益萍
刘志中
-
机构
湖南大学信息科学与工程学院
顺丰科技有限公司
-
出处
《计算机学报》
北大核心
2025年第10期2371-2405,共35页
-
基金
湖南省自然科学基金面上项目(2024JJ5095)资助。
-
文摘
超多目标优化问题因高维决策空间与复杂计算成本等特点而极具挑战。作为求解方法之一,多种群协同进化算法通过协同机制在求解此类问题时有较好的效果,但仍存在计算成本高、搜索效率低等局限性。近年来,强化学习因其卓越的决策能力被引入进化算法框架,成为提升算法性能的关键技术。因此,本文提出了一种深度强化学习引导的多种群协同进化超多目标优化算法DQNMaOEA,用于求解复杂的超多目标优化问题。为了有效引导大规模决策空间的搜索,提高算法在高维目标空间的搜索能力,本文提出了一种基于深度强化学习模型的自适应子种群选择方法,通过强化学习与环境进行交互选择具有更高潜力的子种群,然后与基于效用值选择的子种群进行协同进化,产生具有更优多样性与收敛性的子代解。此外,为了降低计算成本,提高算法的搜索效率,本文进一步提出了一种自适应子种群计算资源分配策略,根据当前子种群对整个种群优化过程的效用值改进贡献,动态分配子种群的适应值评估次数。为了验证算法及相关策略的性能,本文在大量基准测试集问题及实际物流大规模超多目标车辆路径问题实例上,与现有的不同类型前沿算法进行了大量对比实验。实验分析表明,本文提出的算法在求解性能与解质量上显著优于大部分对比算法。具体表现为:在评估解收敛性与多样性的综合指标上,DQNMaOEA在80%以上的基准测试实例中取得最优结果,较现有最佳算法的平均性能指标提升达1.2~2.0倍。而在计算效率方面,算法的平均运行时间较对比算法降低约25%。特别地,在7个实际物流问题实例中,算法在解的性能指标上获得6项最优结果,且求解效率显著优于对比算法。这些结果充分验证了该算法在解质量、计算效率和实际应用潜力上的综合优势。
-
关键词
超多目标优化
超多目标进化算法
自适应种群选择
自适应计算资源分配
强化学习
-
Keywords
many-objective optimization
many-objective evolutionary algorithm
adaptive sub-population selection
adaptive computing resource allocation
reinforcement learning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-