为适应大容量同步发电机组并网点母线电压波动增加对自动电压调节器(automatic voltage regulator,AVR)系统响应能力的更高要求,提出一种基于含探索网络的双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient wi...为适应大容量同步发电机组并网点母线电压波动增加对自动电压调节器(automatic voltage regulator,AVR)系统响应能力的更高要求,提出一种基于含探索网络的双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient with Explorer network,TD3EN)算法的同步发电机励磁电压控制方法。首先,通过传递函数对同步发电机励磁调压子系统进行建模;然后建立TD3EN算法探索网络、动作网络和评价网络,并设置相应参数;接着利用TD3EN算法训练智能体,通过探索网络探索动作空间,并根据评价网络更新动作网络参数,使其为AVR提供控制信号;将训练完成的智能体接入AVR系统,实现对发电机机端电压的控制。仿真结果表明,所提方法提高了AVR系统响应调节指令和应对电压暂降的能力。展开更多
针对配电网可观测率低、可调节设备特性多样导致的电压调控难题,提出一种面向局部可观测场景的多时间尺度电压调控方法。首先,构建部分可观测的电压调控马尔可夫决策模型,并在模型中引入拓扑变化场景,以描述局部可观测情况下配电网运行...针对配电网可观测率低、可调节设备特性多样导致的电压调控难题,提出一种面向局部可观测场景的多时间尺度电压调控方法。首先,构建部分可观测的电压调控马尔可夫决策模型,并在模型中引入拓扑变化场景,以描述局部可观测情况下配电网运行状态与控制动作之间的动态关系。然后,采用双深度Q网络(double deep Q-network,DDQN)和孪生延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法分别训练离散和连续调节设备的电压调控智能体,实现多时间尺度电压调节。通过在训练过程中引入多样拓扑数据,使智能体能在变拓扑条件下学习调控策略,以提升其控制鲁棒性;同时,为解决引入多样拓扑场景造成的训练不均衡问题,提出基于拓扑重要度的采样策略以提升智能体训练收敛性。算例对比与分析验证了该方法在变拓扑条件下电压调控的有效性和优越性。展开更多
文摘为适应大容量同步发电机组并网点母线电压波动增加对自动电压调节器(automatic voltage regulator,AVR)系统响应能力的更高要求,提出一种基于含探索网络的双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient with Explorer network,TD3EN)算法的同步发电机励磁电压控制方法。首先,通过传递函数对同步发电机励磁调压子系统进行建模;然后建立TD3EN算法探索网络、动作网络和评价网络,并设置相应参数;接着利用TD3EN算法训练智能体,通过探索网络探索动作空间,并根据评价网络更新动作网络参数,使其为AVR提供控制信号;将训练完成的智能体接入AVR系统,实现对发电机机端电压的控制。仿真结果表明,所提方法提高了AVR系统响应调节指令和应对电压暂降的能力。
文摘针对配电网可观测率低、可调节设备特性多样导致的电压调控难题,提出一种面向局部可观测场景的多时间尺度电压调控方法。首先,构建部分可观测的电压调控马尔可夫决策模型,并在模型中引入拓扑变化场景,以描述局部可观测情况下配电网运行状态与控制动作之间的动态关系。然后,采用双深度Q网络(double deep Q-network,DDQN)和孪生延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法分别训练离散和连续调节设备的电压调控智能体,实现多时间尺度电压调节。通过在训练过程中引入多样拓扑数据,使智能体能在变拓扑条件下学习调控策略,以提升其控制鲁棒性;同时,为解决引入多样拓扑场景造成的训练不均衡问题,提出基于拓扑重要度的采样策略以提升智能体训练收敛性。算例对比与分析验证了该方法在变拓扑条件下电压调控的有效性和优越性。