期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
计及NWP风速横纵向误差的循环确定性策略梯度风速修正模型 被引量:1
1
作者 黄南天 唐立鹏 戴千斌 《电力系统保护与控制》 EI CSCD 北大核心 2024年第23期10-21,共12页
目前数值天气预报(numerical weatherpr ediction, NWP)风速修正方法大多基于纵向误差的幅值特性评估建模,忽视了NWP风速序列与历史风速序列间超前或延迟效应导致的横向误差对NWP风速修正的潜在影响。因此,提出计及NWP风速横纵向误差的... 目前数值天气预报(numerical weatherpr ediction, NWP)风速修正方法大多基于纵向误差的幅值特性评估建模,忽视了NWP风速序列与历史风速序列间超前或延迟效应导致的横向误差对NWP风速修正的潜在影响。因此,提出计及NWP风速横纵向误差的循环确定性策略梯度(recurrent deterministic policy gradient, RDPG)风速修正模型。首先,基于加权欧式距离相似度确定各个NWP风速待修正点超前/滞后时序区间(lead/lag timing interval, LLTI)边界,构成强相关时序区间。然后,采用LLTI内统计特征代替该区间NWP原始气象特征,并基于沙普利可加性解释法(shapley additive explanation, SHAP)归因理论,根据每个特征的边际贡献评估不同特征对模型输出的影响程度。最后,建立基于RDPG的NWP风速修正模型。通过算例分析,验证了所提方法在超短期、短期预测的不同时间尺度下修正NWP风速的有效性和可行性。 展开更多
关键词 数值天气预报 横向误差 纵向误差 超前/滞后时序区间 循环确定性策略梯度
在线阅读 下载PDF
结合注意力机制与深度强化学习的超短期光伏功率预测 被引量:11
2
作者 丁正凯 傅启明 +4 位作者 陈建平 陆悠 吴宏杰 方能炜 邢镔 《计算机应用》 CSCD 北大核心 2023年第5期1647-1654,共8页
针对传统光伏(PV)功率预测模型受功率随机波动性影响以及易忽略重要信息导致预测精度低的问题,将注意力机制分别与深度确定性策略梯度(DDPG)和循环确定性策略梯度(RDPG)相结合提出了ADDPG和ARDPG模型,并在此基础上提出一个PV功率预测框... 针对传统光伏(PV)功率预测模型受功率随机波动性影响以及易忽略重要信息导致预测精度低的问题,将注意力机制分别与深度确定性策略梯度(DDPG)和循环确定性策略梯度(RDPG)相结合提出了ADDPG和ARDPG模型,并在此基础上提出一个PV功率预测框架。首先,将原始PV功率数据以及气象数据标准化,并将PV功率预测问题建模为马尔可夫决策过程(MDP),历史功率数据和当前气象数据则作为MDP的状态;然后,将注意力机制加入DDPG和RDPG的Actor网络,赋予状态中各个分量不同的权重来突出重要且关键的信息,并通过深度强化学习智能体和历史数据的交互来学习数据中的关键信息;最后,求解MDP问题得到最优的策略,作出准确的预测。在DKASC、Alice Springs光伏系统数据上的实验结果表明,ADDPG和ARDPG在均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)上均取得了最优结果。可见,所提模型能够有效提高PV功率的预测精度,也可以推广到其他预测领域如电网预测、风力发电预测等。 展开更多
关键词 深度强化学习 注意力机制 光伏功率预测 深度确定性策略梯度 循环确定性策略梯度
在线阅读 下载PDF
基于深度强化学习的智能路由技术研究 被引量:8
3
作者 黄万伟 郑向雨 +2 位作者 张超钦 王苏南 张校辉 《郑州大学学报(工学版)》 CAS 北大核心 2023年第1期44-51,共8页
针对现有智能路由算法收敛速度慢、平均时延高、带宽利用率低等问题,提出了一种基于深度强化学习(DRL)的多路径智能路由算法RDPG-Route。该算法采用循环确定性策略梯度(RDPG)作为训练框架,引入长短期记忆网络(LSTM)作为神经网络,基于RDP... 针对现有智能路由算法收敛速度慢、平均时延高、带宽利用率低等问题,提出了一种基于深度强化学习(DRL)的多路径智能路由算法RDPG-Route。该算法采用循环确定性策略梯度(RDPG)作为训练框架,引入长短期记忆网络(LSTM)作为神经网络,基于RDPG处理高纬度问题的算法优势,以及LSTM循环核中记忆体的存储能力,将动态变化的网络状态输入神经网络进行训练。算法训练收敛后,将神经网络输出的动作值作为网络链路权重,基于多路径路由策略进行流量划分,以实现网络路由的智能动态调整。最后,将RDPG-Route路由算法分别与ECMP、DRL-TE和DRL-R-DDPG路由算法进行对比。结果表明,RDPG-Route具有较好的收敛性和有效性,相比于其他智能路由算法至少降低了7.2%平均端到端时延,提高了6.5%吞吐量,减少了8.9%丢包率和6.3%的最大链路利用率。 展开更多
关键词 体验质量 软件定义网络 深度强化学习 路由算法 循环确定性策略梯度
在线阅读 下载PDF
基于改进DDPG的中央空调负荷预测方法研究 被引量:3
4
作者 贾静 高文忠 《电子测量技术》 北大核心 2022年第3期85-91,共7页
为降低因节假日引起的建筑内部得热对大型中央空调系统负荷预测精度的负面影响,以上海世博园区某办公建筑群作为研究区域,引入新的日期特征DPH,在现有深度确定性策略梯度网络结构的基础上,利用长短期记忆神经网络替换深度确定性策略梯... 为降低因节假日引起的建筑内部得热对大型中央空调系统负荷预测精度的负面影响,以上海世博园区某办公建筑群作为研究区域,引入新的日期特征DPH,在现有深度确定性策略梯度网络结构的基础上,利用长短期记忆神经网络替换深度确定性策略梯度的全连接神经网络,提出基于循环确定性策略梯度的大型中央空调系统冷负荷预测方法。研究结果表明,考虑DPH日期特征的改进算法预测模型能够捕捉因节假日引起的负荷变化趋势,有效提高预测准确性,预测精度达0.951,误差值为7.08%。 展开更多
关键词 空调负荷预测 冷热电三联供系统 长短期记忆神经网络 循环确定性策略梯度 深度强化学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部