期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
改进算法下考虑激励相容的双回收再制造供应链鲁棒优化
1
作者 王振 叶春明 郭健全 《复杂系统与复杂性科学》 北大核心 2025年第3期104-112,共9页
为研究政府补贴对新能源汽车再制造供应链不同回收渠道的影响,建立双回收渠道下的多目标模型,改进鲁棒优化法解决回收时需求量和回收量不确定问题,并提出了卷积神经网络(Conv-GLU网络)方法对模型求解。通过对比线上线下回收渠道、联合... 为研究政府补贴对新能源汽车再制造供应链不同回收渠道的影响,建立双回收渠道下的多目标模型,改进鲁棒优化法解决回收时需求量和回收量不确定问题,并提出了卷积神经网络(Conv-GLU网络)方法对模型求解。通过对比线上线下回收渠道、联合回收渠道以及政府干预下的回收渠道的表现,政府干预下的多目标最优。研究表明,大数据背景下政府可以对回收时进行合理干预,帮助新能源汽车企业建立双回收渠道再制造绿色供应链。 展开更多
关键词 双回收渠道 激励相容理论 鲁棒优化 多目标 改进深度学习算法 政府补贴
在线阅读 下载PDF
基于改进深度强化学习的电力智慧供应链高维度决策模型研究 被引量:16
2
作者 刘中明 周岩 +2 位作者 刘博 安林林 赵云强 《电子测量技术》 2019年第23期53-60,共8页
着眼构建具备“建设一体化、检测自主化、监造可视化、分析智能化”属性的电力全景质控供应链,提出了一种基于改进深度强化学习的电力智慧供应链高维度决策模型。借助国家电网公司全景数据中心,构建大数据量级共享数据资源池,引入改进... 着眼构建具备“建设一体化、检测自主化、监造可视化、分析智能化”属性的电力全景质控供应链,提出了一种基于改进深度强化学习的电力智慧供应链高维度决策模型。借助国家电网公司全景数据中心,构建大数据量级共享数据资源池,引入改进深度强化学习算法建立智慧决策、智能监控、全景可视、专业协同与智慧供应链之间的高维度决策映射,实现多维差异性系统数据的横向共享集成。选取国网供应链某核心节点为效能评价载体,开发对应原型系统并对模型综合效能进行实证分析,结果表明原型系统具备智能采购、数字物流、全景质控等全方位立体智慧供应链体系效能,在数据集成共享性、供应链全局协同性、供需精准匹配性、泛在电力物联网实践性等方面具有明显优势。 展开更多
关键词 电力物资 改进深度强化学习算法 智慧供应链 决策模型 原型系统
在线阅读 下载PDF
基于改进DQN强化学习算法的弹性光网络资源分配研究 被引量:3
3
作者 尚晓凯 韩龙龙 翟慧鹏 《光通信技术》 2023年第5期12-15,共4页
针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法。该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率。通过这种方式,实现... 针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法。该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率。通过这种方式,实现了最优的动作值函数,并较好地解决了路由与频谱分配问题。此外,采用了不同的经验池取样方法,以提高迭代训练的收敛速度。仿真结果表明:改进DQN强化学习算法不仅能够使弹性光网络训练模型快速收敛,当业务量为300 Erlang时,比DQN算法频谱资源利用率提高了10.09%,阻塞率降低了12.41%,平均访问时延减少了1.27 ms。 展开更多
关键词 弹性光网络 改进深度Q网络强化学习算法 资源分配
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部