随着新一代信息通信技术,如5G、云计算和人工智能的不断演进,世界正迅速迈入数字经济的快车道。针对数据中心中可再生能源和工作负载预测的不确定性,提出了一种基于多智能体近端策略网络的数据中心双层优化调度方法。首先,建立了数据中...随着新一代信息通信技术,如5G、云计算和人工智能的不断演进,世界正迅速迈入数字经济的快车道。针对数据中心中可再生能源和工作负载预测的不确定性,提出了一种基于多智能体近端策略网络的数据中心双层优化调度方法。首先,建立了数据中心双层时空优化调度框架,对数据中心工作负载、IT设备、空调设备进行详细建模;在此基础上,提出数据中心的双层优化调度模型,上层以互联网数据中心(Internet data center,IDC)运营管理商总运营成本最小为目标进行时间维度调度,下层以各IDC运行成本最低为目标进行空间维度调度;然后,介绍多智能体近端策略网络算法原理,设计数据中心双层优化调度模型的状态空间、动作空间和奖励函数。最后,针对算例进行离线训练和在线调度决策,仿真结果表明,所提模型和方法能够有效降低系统成本和能耗,实现工作负载的最佳分配,具有较好的经济性和鲁棒性。展开更多
深度强化学习是实现建筑能源系统(building energy system,BES)优化控制的有效方法,但其实际应用面临模型训练收敛效率低和室温约束越限的挑战。为解决这一难题,提出一种考虑虚拟储能系统(virtual energy storage system,VESS)的BES近...深度强化学习是实现建筑能源系统(building energy system,BES)优化控制的有效方法,但其实际应用面临模型训练收敛效率低和室温约束越限的挑战。为解决这一难题,提出一种考虑虚拟储能系统(virtual energy storage system,VESS)的BES近端策略优化(proximal policy optimization,PPO)控制方法。首先,基于建筑围护结构的热惰性特性,构建了建筑VESS模型,并提出了虚拟功率、虚拟容量和虚拟荷电状态3个VESS参数,用以量化热惰性提供的BES可调潜力;在此基础上,将包含VESS的BES模型转化为马尔可夫决策过程,并定义了相应的状态变量、控制动作、奖励函数和转移函数;最后,采用PPO算法对BES进行优化控制。算例结果表明,所提方法有效降低了BES运行成本和室温越限比例,同时显著提升了优化控制策略的生成速度。展开更多
文摘随着新一代信息通信技术,如5G、云计算和人工智能的不断演进,世界正迅速迈入数字经济的快车道。针对数据中心中可再生能源和工作负载预测的不确定性,提出了一种基于多智能体近端策略网络的数据中心双层优化调度方法。首先,建立了数据中心双层时空优化调度框架,对数据中心工作负载、IT设备、空调设备进行详细建模;在此基础上,提出数据中心的双层优化调度模型,上层以互联网数据中心(Internet data center,IDC)运营管理商总运营成本最小为目标进行时间维度调度,下层以各IDC运行成本最低为目标进行空间维度调度;然后,介绍多智能体近端策略网络算法原理,设计数据中心双层优化调度模型的状态空间、动作空间和奖励函数。最后,针对算例进行离线训练和在线调度决策,仿真结果表明,所提模型和方法能够有效降低系统成本和能耗,实现工作负载的最佳分配,具有较好的经济性和鲁棒性。
文摘深度强化学习是实现建筑能源系统(building energy system,BES)优化控制的有效方法,但其实际应用面临模型训练收敛效率低和室温约束越限的挑战。为解决这一难题,提出一种考虑虚拟储能系统(virtual energy storage system,VESS)的BES近端策略优化(proximal policy optimization,PPO)控制方法。首先,基于建筑围护结构的热惰性特性,构建了建筑VESS模型,并提出了虚拟功率、虚拟容量和虚拟荷电状态3个VESS参数,用以量化热惰性提供的BES可调潜力;在此基础上,将包含VESS的BES模型转化为马尔可夫决策过程,并定义了相应的状态变量、控制动作、奖励函数和转移函数;最后,采用PPO算法对BES进行优化控制。算例结果表明,所提方法有效降低了BES运行成本和室温越限比例,同时显著提升了优化控制策略的生成速度。