伴随世界能源消费和碳排放总量持续增长,能源技术革命及发展低碳能源已成为共识。电-气(power-to-gas,P2G)综合能源系统中,碳捕集技术与电转气(carbon capture,utilization and storage,CCUS)技术的协同运行以及考虑可再生能源不确定性...伴随世界能源消费和碳排放总量持续增长,能源技术革命及发展低碳能源已成为共识。电-气(power-to-gas,P2G)综合能源系统中,碳捕集技术与电转气(carbon capture,utilization and storage,CCUS)技术的协同运行以及考虑可再生能源不确定性的优化调度值得被研究。提出了一种基于信息间隙决策理论的电-气综合能源系统低碳经济调度模型,构建电-气综合能源系统典型结构、耦合设备模型,基于系统内部碳排放-回收-利用路径建立碳捕集-电转气协同运行模型,引入含阶梯式碳交易的电-气综合能源系统低碳经济运行模型,提出了基于信息间隙决策理论(information gap decision theory,IGDT)的电-气综合能源系统低碳经济调度模型及模型求解方法,并在IEEE 24 RTS(reliability test system)系统和10节点天然气系统构成的电-气综合能源系统中分析了模型在降低系统碳排放和应对可再生能源出力不确定性方面的有效性。展开更多
针对基于深度强化学习的自主超声扫描方法存在训练扫描精度低、训练时间长、扫描任务成功率较低的问题,提出了一种基于改进型多模态信息融合深度强化学习的自主超声扫描方法。首先,该方法融合了超声图像、双视角探头操作图像和6D触觉反...针对基于深度强化学习的自主超声扫描方法存在训练扫描精度低、训练时间长、扫描任务成功率较低的问题,提出了一种基于改进型多模态信息融合深度强化学习的自主超声扫描方法。首先,该方法融合了超声图像、双视角探头操作图像和6D触觉反馈提供全面的多模态感知信息。为精准捕捉多模态中的时空信息和实现多模态特征的高效融合,设计了一个基于自注意力机制(self-attention mechanism,SA)的多模态特征提取与融合模块。其次,将机器人的6D位姿动作决策任务建模为深度强化学习问题。为贴近专业超声从业医生的操作,设计了混合奖励函数。最后,为解决深度强化学习训练中出现的局部最优和收敛速度慢的问题,提出了DSAC-PERDP(discrete soft actor-critic with prioritized experience replay based on dynamic priority)算法。在真实环境中的测试表明,该方法在扫描精度、任务成功率和训练速度方面较基线模型分别提升了49.8%、13.4%和260.0%,在干扰条件下仍保持良好性能。实验证明,该方法显著提升了扫描精度、任务成功率和训练速度,并具有一定的抗干扰能力。展开更多
文摘伴随世界能源消费和碳排放总量持续增长,能源技术革命及发展低碳能源已成为共识。电-气(power-to-gas,P2G)综合能源系统中,碳捕集技术与电转气(carbon capture,utilization and storage,CCUS)技术的协同运行以及考虑可再生能源不确定性的优化调度值得被研究。提出了一种基于信息间隙决策理论的电-气综合能源系统低碳经济调度模型,构建电-气综合能源系统典型结构、耦合设备模型,基于系统内部碳排放-回收-利用路径建立碳捕集-电转气协同运行模型,引入含阶梯式碳交易的电-气综合能源系统低碳经济运行模型,提出了基于信息间隙决策理论(information gap decision theory,IGDT)的电-气综合能源系统低碳经济调度模型及模型求解方法,并在IEEE 24 RTS(reliability test system)系统和10节点天然气系统构成的电-气综合能源系统中分析了模型在降低系统碳排放和应对可再生能源出力不确定性方面的有效性。
文摘针对基于深度强化学习的自主超声扫描方法存在训练扫描精度低、训练时间长、扫描任务成功率较低的问题,提出了一种基于改进型多模态信息融合深度强化学习的自主超声扫描方法。首先,该方法融合了超声图像、双视角探头操作图像和6D触觉反馈提供全面的多模态感知信息。为精准捕捉多模态中的时空信息和实现多模态特征的高效融合,设计了一个基于自注意力机制(self-attention mechanism,SA)的多模态特征提取与融合模块。其次,将机器人的6D位姿动作决策任务建模为深度强化学习问题。为贴近专业超声从业医生的操作,设计了混合奖励函数。最后,为解决深度强化学习训练中出现的局部最优和收敛速度慢的问题,提出了DSAC-PERDP(discrete soft actor-critic with prioritized experience replay based on dynamic priority)算法。在真实环境中的测试表明,该方法在扫描精度、任务成功率和训练速度方面较基线模型分别提升了49.8%、13.4%和260.0%,在干扰条件下仍保持良好性能。实验证明,该方法显著提升了扫描精度、任务成功率和训练速度,并具有一定的抗干扰能力。