检索结果-维普期刊中文期刊服务平台

计及NWP风速横纵向误差的循环确定性策略梯度风速修正模型被引量：2: 1; 作者黄南天唐立鹏戴千斌《电力系统保护与控制》 EI CSCD 北大核心 2024年第23期10-21,共12页; 目前数值天气预报(numerical weatherpr ediction, NWP)风速修正方法大多基于纵向误差的幅值特性评估建模,忽视了NWP风速序列与历史风速序列间超前或延迟效应导致的横向误差对NWP风速修正的潜在影响。因此,提出计及NWP风速横纵向误差的... 展开更多; 关键词数值天气预报横向误差纵向误差超前/滞后时序区间循环确定性策略梯度; 在线阅读下载PDF 职称材料

结合注意力机制与深度强化学习的超短期光伏功率预测被引量：12: 2; 作者丁正凯傅启明 +4 位作者陈建平陆悠吴宏杰方能炜邢镔《计算机应用》 CSCD 北大核心 2023年第5期1647-1654,共8页; 针对传统光伏(PV)功率预测模型受功率随机波动性影响以及易忽略重要信息导致预测精度低的问题,将注意力机制分别与深度确定性策略梯度(DDPG)和循环确定性策略梯度(RDPG)相结合提出了ADDPG和ARDPG模型,并在此基础上提出一个PV功率预测框... 展开更多; 关键词深度强化学习注意力机制光伏功率预测深度确定性策略梯度循环确定性策略梯度; 在线阅读下载PDF 职称材料

基于深度强化学习的智能路由技术研究被引量：8: 3; 作者黄万伟郑向雨 +2 位作者张超钦王苏南张校辉《郑州大学学报（工学版）》 CAS 北大核心 2023年第1期44-51,共8页; 针对现有智能路由算法收敛速度慢、平均时延高、带宽利用率低等问题,提出了一种基于深度强化学习(DRL)的多路径智能路由算法RDPG-Route。该算法采用循环确定性策略梯度(RDPG)作为训练框架,引入长短期记忆网络(LSTM)作为神经网络,基于RDP... 展开更多; 关键词体验质量软件定义网络深度强化学习路由算法循环确定性策略梯度; 在线阅读下载PDF 职称材料

基于改进DDPG的中央空调负荷预测方法研究被引量：4: 4; 作者贾静高文忠《电子测量技术》北大核心 2022年第3期85-91,共7页; 为降低因节假日引起的建筑内部得热对大型中央空调系统负荷预测精度的负面影响,以上海世博园区某办公建筑群作为研究区域,引入新的日期特征DPH,在现有深度确定性策略梯度网络结构的基础上,利用长短期记忆神经网络替换深度确定性策略梯... 展开更多; 关键词空调负荷预测冷热电三联供系统长短期记忆神经网络循环确定性策略梯度深度强化学习; 在线阅读下载PDF 职称材料

题名计及NWP风速横纵向误差的循环确定性策略梯度风速修正模型被引量：2: 1; 作者黄南天唐立鹏戴千斌; 机构现代电力系统仿真控制与绿色电能新技术教育部重点实验室(东北电力大学) 辽宁蒲石河抽水蓄能有限公司; 出处《电力系统保护与控制》 EI CSCD 北大核心 2024年第23期10-21,共12页; 基金吉林省科技发展计划项目资助(20210201126GX)。; 文摘目前数值天气预报(numerical weatherpr ediction, NWP)风速修正方法大多基于纵向误差的幅值特性评估建模,忽视了NWP风速序列与历史风速序列间超前或延迟效应导致的横向误差对NWP风速修正的潜在影响。因此,提出计及NWP风速横纵向误差的循环确定性策略梯度(recurrent deterministic policy gradient, RDPG)风速修正模型。首先,基于加权欧式距离相似度确定各个NWP风速待修正点超前/滞后时序区间(lead/lag timing interval, LLTI)边界,构成强相关时序区间。然后,采用LLTI内统计特征代替该区间NWP原始气象特征,并基于沙普利可加性解释法(shapley additive explanation, SHAP)归因理论,根据每个特征的边际贡献评估不同特征对模型输出的影响程度。最后,建立基于RDPG的NWP风速修正模型。通过算例分析,验证了所提方法在超短期、短期预测的不同时间尺度下修正NWP风速的有效性和可行性。; 关键词数值天气预报横向误差纵向误差超前/滞后时序区间循环确定性策略梯度; Keywords numerical weather prediction longitudinal error lateral error lead/lag timing interval recurrent deterministic policy gradient; 分类号 TM614 [电气工程—电力系统及自动化] P456.7 [天文地球—大气科学及气象学]; 在线阅读下载PDF 职称材料

题名结合注意力机制与深度强化学习的超短期光伏功率预测被引量：12: 2; 作者丁正凯傅启明陈建平陆悠吴宏杰方能炜邢镔; 机构苏州科技大学电子与信息工程学院江苏省建筑智慧节能重点实验室(苏州科技大学) 苏州科技大学建筑与城市规划学院重庆工业大数据创新中心有限公司; 出处《计算机应用》 CSCD 北大核心 2023年第5期1647-1654,共8页; 基金国家重点研发计划项目(2020YFC2006602) 国家自然科学基金资助项目(62102278,62072324,61876217,61876121,61772357) +2 种基金江苏省自然科学基金资助项目(BK20190942)。; 文摘针对传统光伏(PV)功率预测模型受功率随机波动性影响以及易忽略重要信息导致预测精度低的问题,将注意力机制分别与深度确定性策略梯度(DDPG)和循环确定性策略梯度(RDPG)相结合提出了ADDPG和ARDPG模型,并在此基础上提出一个PV功率预测框架。首先,将原始PV功率数据以及气象数据标准化,并将PV功率预测问题建模为马尔可夫决策过程(MDP),历史功率数据和当前气象数据则作为MDP的状态;然后,将注意力机制加入DDPG和RDPG的Actor网络,赋予状态中各个分量不同的权重来突出重要且关键的信息,并通过深度强化学习智能体和历史数据的交互来学习数据中的关键信息;最后,求解MDP问题得到最优的策略,作出准确的预测。在DKASC、Alice Springs光伏系统数据上的实验结果表明,ADDPG和ARDPG在均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)上均取得了最优结果。可见,所提模型能够有效提高PV功率的预测精度,也可以推广到其他预测领域如电网预测、风力发电预测等。; 关键词深度强化学习注意力机制光伏功率预测深度确定性策略梯度循环确定性策略梯度; Keywords deep reinforcement learning attention mechanism PhotoVoltaic(PV)power prediction Deep Deterministic Policy Gradient(DDPG) Recurrent Deterministic Policy Gradient(RDPG); 分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于深度强化学习的智能路由技术研究被引量：8: 3; 作者黄万伟郑向雨张超钦王苏南张校辉; 机构郑州轻工业大学软件学院郑州轻工业大学计算机与通信工程学院深圳职业技术学院电子与通信工程学院河南信安通信技术股份有限公司; 出处《郑州大学学报（工学版）》 CAS 北大核心 2023年第1期44-51,共8页; 基金国家自然科学基金资助项目(62002382,62072416) 河南省重点研发与推广专项(科技攻关)(222102210175,222102210111) 2022年河南省专业学位研究生精品教学案例项目(YJS2022AL035)。; 文摘针对现有智能路由算法收敛速度慢、平均时延高、带宽利用率低等问题,提出了一种基于深度强化学习(DRL)的多路径智能路由算法RDPG-Route。该算法采用循环确定性策略梯度(RDPG)作为训练框架,引入长短期记忆网络(LSTM)作为神经网络,基于RDPG处理高纬度问题的算法优势,以及LSTM循环核中记忆体的存储能力,将动态变化的网络状态输入神经网络进行训练。算法训练收敛后,将神经网络输出的动作值作为网络链路权重,基于多路径路由策略进行流量划分,以实现网络路由的智能动态调整。最后,将RDPG-Route路由算法分别与ECMP、DRL-TE和DRL-R-DDPG路由算法进行对比。结果表明,RDPG-Route具有较好的收敛性和有效性,相比于其他智能路由算法至少降低了7.2%平均端到端时延,提高了6.5%吞吐量,减少了8.9%丢包率和6.3%的最大链路利用率。; 关键词体验质量软件定义网络深度强化学习路由算法循环确定性策略梯度; Keywords quality of experience software defined network deep reinforcement learning routing algorithms re-current deterministic policy gradient; 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于改进DDPG的中央空调负荷预测方法研究被引量：4: 4; 作者贾静高文忠; 机构上海海事大学商船学院; 出处《电子测量技术》北大核心 2022年第3期85-91,共7页; 基金上海科学技术委员会项目(18040501800) 上海市科技计划项目(20DZ2252300)资助。; 文摘为降低因节假日引起的建筑内部得热对大型中央空调系统负荷预测精度的负面影响,以上海世博园区某办公建筑群作为研究区域,引入新的日期特征DPH,在现有深度确定性策略梯度网络结构的基础上,利用长短期记忆神经网络替换深度确定性策略梯度的全连接神经网络,提出基于循环确定性策略梯度的大型中央空调系统冷负荷预测方法。研究结果表明,考虑DPH日期特征的改进算法预测模型能够捕捉因节假日引起的负荷变化趋势,有效提高预测准确性,预测精度达0.951,误差值为7.08%。; 关键词空调负荷预测冷热电三联供系统长短期记忆神经网络循环确定性策略梯度深度强化学习; Keywords air-conditioning load forecasting CCHP long short-term memory recurrent deterministic policy gradient deep reinforcement learning; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	计及NWP风速横纵向误差的循环确定性策略梯度风速修正模型	黄南天唐立鹏戴千斌	《电力系统保护与控制》 EI CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料
2	结合注意力机制与深度强化学习的超短期光伏功率预测	丁正凯傅启明陈建平陆悠吴宏杰方能炜邢镔	《计算机应用》 CSCD 北大核心	2023	12	在线阅读下载PDF 职称材料
3	基于深度强化学习的智能路由技术研究	黄万伟郑向雨张超钦王苏南张校辉	《郑州大学学报（工学版）》 CAS 北大核心	2023	8	在线阅读下载PDF 职称材料
4	基于改进DDPG的中央空调负荷预测方法研究	贾静高文忠	《电子测量技术》北大核心	2022	4	在线阅读下载PDF 职称材料