提升风电机组偏航系统在多工况场景下的动态性能至关重要。基于此,提出了一种基于强化学习的风电机组偏航系统模型预测控制策略,通过双延迟深度确定性策略梯度(TD3)算法实现多目标参数动态优化。首先,针对功率损失率和偏航执行器使用率...提升风电机组偏航系统在多工况场景下的动态性能至关重要。基于此,提出了一种基于强化学习的风电机组偏航系统模型预测控制策略,通过双延迟深度确定性策略梯度(TD3)算法实现多目标参数动态优化。首先,针对功率损失率和偏航执行器使用率2个相互矛盾的控制目标,建立偏航系统的多步模型预测控制器(yaw model predictive control,YMPC);其次,针对偏航系统的优化目标及风况特性设计双延迟深度确定性策略梯度(TD3)智能体的输入状态、动作和奖励机制,从而使用TD3智能体整定YMPC的权重系数和控制步长;最后,采用中国北方风电场典型日数据验证了该方法的有效性。结果表明,与固定控制参数的YMPC相比,所提出的策略显著提升了偏航系统的综合性能。展开更多
文摘提升风电机组偏航系统在多工况场景下的动态性能至关重要。基于此,提出了一种基于强化学习的风电机组偏航系统模型预测控制策略,通过双延迟深度确定性策略梯度(TD3)算法实现多目标参数动态优化。首先,针对功率损失率和偏航执行器使用率2个相互矛盾的控制目标,建立偏航系统的多步模型预测控制器(yaw model predictive control,YMPC);其次,针对偏航系统的优化目标及风况特性设计双延迟深度确定性策略梯度(TD3)智能体的输入状态、动作和奖励机制,从而使用TD3智能体整定YMPC的权重系数和控制步长;最后,采用中国北方风电场典型日数据验证了该方法的有效性。结果表明,与固定控制参数的YMPC相比,所提出的策略显著提升了偏航系统的综合性能。