期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
不确定环境下快递包装回收网络多目标规划
1
作者 张琦琪 张涛 《包装工程》 北大核心 2025年第17期304-313,共10页
目的针对不确定环境下快递包装回收再利用问题,构建包含快递网点、回收中心、再加工中心、转售市场和填埋点在内的五级逆向物流网络。在选址-分配问题中考虑快递包装回收数量和质量上的不确定性,以最小化经济成本、环境成本为目标,建立... 目的针对不确定环境下快递包装回收再利用问题,构建包含快递网点、回收中心、再加工中心、转售市场和填埋点在内的五级逆向物流网络。在选址-分配问题中考虑快递包装回收数量和质量上的不确定性,以最小化经济成本、环境成本为目标,建立多目标整数规划模型。方法引入模糊机会约束规划理论,将不确定性模型转化为确定性等价形式。采用Epsilon约束法对多目标进行处理,生成Pareto最优解集。结果将所构建模型应用于包含20个快递网点、4个回收中心、4个再加工中心、2个市场和1个填埋点的仿真案例中进行求解,可生成较均衡的Pareto前沿,得到较优的选址与分配方案。结论该方法可有效协调经济与环境目标,降低快递包装回收对环境影响。参数分析揭示了二者间的权衡关系,为构建绿色、高效的快递包装回收体系提供了理论与实践支持。 展开更多
关键词 不确定环境 模糊机会约束规划 选址与分配问题 逆向物流 多目标优化 Epsilon约束
在线阅读 下载PDF
基于预测状态表示的Q学习算法 被引量:3
2
作者 刘云龙 李人厚 刘建书 《西安交通大学学报》 EI CAS CSCD 北大核心 2008年第12期1472-1475,1485,共5页
针对不确定环境的规划问题,提出了基于预测状态表示的Q学习算法.将预测状态表示方法与Q学习算法结合,用预测状态表示的预测向量作为Q学习算法的状态表示,使得到的状态具有马尔可夫特性,满足强化学习任务的要求,进而用Q学习算法学习智能... 针对不确定环境的规划问题,提出了基于预测状态表示的Q学习算法.将预测状态表示方法与Q学习算法结合,用预测状态表示的预测向量作为Q学习算法的状态表示,使得到的状态具有马尔可夫特性,满足强化学习任务的要求,进而用Q学习算法学习智能体的最优策略,可解决不确定环境下的规划问题.仿真结果表明,在发现智能体的最优近似策略时,算法需要的学习周期数与假定环境状态已知情况下需要的学习周期数大致相同. 展开更多
关键词 不确定环境规划 预测状态表示 Q学习算法 奶酪迷宫
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部