为适应大容量同步发电机组并网点母线电压波动增加对自动电压调节器(automatic voltage regulator,AVR)系统响应能力的更高要求,提出一种基于含探索网络的双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient wi...为适应大容量同步发电机组并网点母线电压波动增加对自动电压调节器(automatic voltage regulator,AVR)系统响应能力的更高要求,提出一种基于含探索网络的双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient with Explorer network,TD3EN)算法的同步发电机励磁电压控制方法。首先,通过传递函数对同步发电机励磁调压子系统进行建模;然后建立TD3EN算法探索网络、动作网络和评价网络,并设置相应参数;接着利用TD3EN算法训练智能体,通过探索网络探索动作空间,并根据评价网络更新动作网络参数,使其为AVR提供控制信号;将训练完成的智能体接入AVR系统,实现对发电机机端电压的控制。仿真结果表明,所提方法提高了AVR系统响应调节指令和应对电压暂降的能力。展开更多
针对基于深度强化学习的自主超声扫描方法存在训练扫描精度低、训练时间长、扫描任务成功率较低的问题,提出了一种基于改进型多模态信息融合深度强化学习的自主超声扫描方法。首先,该方法融合了超声图像、双视角探头操作图像和6D触觉反...针对基于深度强化学习的自主超声扫描方法存在训练扫描精度低、训练时间长、扫描任务成功率较低的问题,提出了一种基于改进型多模态信息融合深度强化学习的自主超声扫描方法。首先,该方法融合了超声图像、双视角探头操作图像和6D触觉反馈提供全面的多模态感知信息。为精准捕捉多模态中的时空信息和实现多模态特征的高效融合,设计了一个基于自注意力机制(self-attention mechanism,SA)的多模态特征提取与融合模块。其次,将机器人的6D位姿动作决策任务建模为深度强化学习问题。为贴近专业超声从业医生的操作,设计了混合奖励函数。最后,为解决深度强化学习训练中出现的局部最优和收敛速度慢的问题,提出了DSAC-PERDP(discrete soft actor-critic with prioritized experience replay based on dynamic priority)算法。在真实环境中的测试表明,该方法在扫描精度、任务成功率和训练速度方面较基线模型分别提升了49.8%、13.4%和260.0%,在干扰条件下仍保持良好性能。实验证明,该方法显著提升了扫描精度、任务成功率和训练速度,并具有一定的抗干扰能力。展开更多
文摘为适应大容量同步发电机组并网点母线电压波动增加对自动电压调节器(automatic voltage regulator,AVR)系统响应能力的更高要求,提出一种基于含探索网络的双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient with Explorer network,TD3EN)算法的同步发电机励磁电压控制方法。首先,通过传递函数对同步发电机励磁调压子系统进行建模;然后建立TD3EN算法探索网络、动作网络和评价网络,并设置相应参数;接着利用TD3EN算法训练智能体,通过探索网络探索动作空间,并根据评价网络更新动作网络参数,使其为AVR提供控制信号;将训练完成的智能体接入AVR系统,实现对发电机机端电压的控制。仿真结果表明,所提方法提高了AVR系统响应调节指令和应对电压暂降的能力。
文摘针对基于深度强化学习的自主超声扫描方法存在训练扫描精度低、训练时间长、扫描任务成功率较低的问题,提出了一种基于改进型多模态信息融合深度强化学习的自主超声扫描方法。首先,该方法融合了超声图像、双视角探头操作图像和6D触觉反馈提供全面的多模态感知信息。为精准捕捉多模态中的时空信息和实现多模态特征的高效融合,设计了一个基于自注意力机制(self-attention mechanism,SA)的多模态特征提取与融合模块。其次,将机器人的6D位姿动作决策任务建模为深度强化学习问题。为贴近专业超声从业医生的操作,设计了混合奖励函数。最后,为解决深度强化学习训练中出现的局部最优和收敛速度慢的问题,提出了DSAC-PERDP(discrete soft actor-critic with prioritized experience replay based on dynamic priority)算法。在真实环境中的测试表明,该方法在扫描精度、任务成功率和训练速度方面较基线模型分别提升了49.8%、13.4%和260.0%,在干扰条件下仍保持良好性能。实验证明,该方法显著提升了扫描精度、任务成功率和训练速度,并具有一定的抗干扰能力。