期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
SDWN中基于多智能体图强化学习的多对多通信路由方法
1
作者
文鹏
叶苗
+2 位作者
王勇
何倩
仇洪冰
《电子学报》
北大核心
2025年第6期1885-1905,共21页
多对多通信路由问题是NP(Nondeterministic Polynomial time)难的组合优化问题,构建出高效的多对多通信路由路径还需及时获取全局网络状态信息以适应网络状态高度动态变化的特点.本文在软件定义无线网络(Software-Defined Wireless Netw...
多对多通信路由问题是NP(Nondeterministic Polynomial time)难的组合优化问题,构建出高效的多对多通信路由路径还需及时获取全局网络状态信息以适应网络状态高度动态变化的特点.本文在软件定义无线网络(Software-Defined Wireless Networks,SDWN)场景中针对现有数据驱动的多智能体深度强化学习方法存在计算和部署成本高、难以适应非欧结构特点的网络拓扑的问题,并且训练过程中无效动作过多会增加存储空间和时间开销以及收敛速度慢,本文设计了一种SDN控制平面和数据平面进行协同感知与智能决策的新框架,并针对多对多通信路由问题设计了一种两阶段的多智能体路由方法(基于智能节点部署策略的多智能体图强化学习方法:MAGDS-M2M).为了降低在每个节点上都部署智能体所带来的计算和部署成本,设计了一种基于Q-学习的智能节点部署算法来确定需要部署智能体的网络节点;在完成多智能体部署后,在Actor-Critic(AC)框架下设计了一种基于多智能体图强化学习的多对多路由决策方法,基于图卷积网络(Graph Convolutional Networks,GCN)和图神经网络(Graph Neural Networks,GNN)重新设计Actor和Critic网络,解决了现有多智能体强化学习方法中卷积神经网络(Convolutional Neural Networks,CNN)对拓扑结构数据适应能力比较弱的问题;此外,为解决Actor网络固定长度的动作空间在训练过程中产生大量无效动作的问题,设计了一种新的动作空间局部观测方法.实验结果表明所提出的方法相比于基准实验降低了29.33%任务完成时延,并且验证了可以通过调节参数使任务完成的时延和各节点累计能耗标准差之间达到平衡.本文所做工作源代码已提交至开源平台https://github.com/GuetYe/MAGDS-M2M.
展开更多
关键词
多对多通信
智能
节点部署
多智能体图强化学习
动作空间局部观测方法
软件定义无线网络
在线阅读
下载PDF
职称材料
基于图强化学习的含光储配电网无功优化方法
被引量:
2
2
作者
全欢
胡建军
+4 位作者
刘肇熙
谭科
祝敬华
陈逸凡
肖嘉睿
《广东电力》
北大核心
2024年第12期79-86,共8页
传统的无功优化方法已无法适应大规模分布式能源接入下的新型配电网,为了更好的应对含高比例新能源配电网的无功实时调度,提出一种基于图强化学习的配电网无功优化方法。首先,在分区分散式控制框架下根据配电网无功优化控制模型构造部...
传统的无功优化方法已无法适应大规模分布式能源接入下的新型配电网,为了更好的应对含高比例新能源配电网的无功实时调度,提出一种基于图强化学习的配电网无功优化方法。首先,在分区分散式控制框架下根据配电网无功优化控制模型构造部分可观测马尔可夫决策过程。然后,提出基于物理信息强化学习范式的多智能体深度确定性策略梯度算法,通过图卷积神经网络挖掘拓扑结构的物理信息。随后,基于集中式训练-分散式执行的框架对马尔可夫决策过程进行求解,得到离线训练阶段的最优策略。最后,将训练好的模型在线应用,仿真结果表明所提方法能够有效应对电压波动和源荷不确定性,具有较好的实时性、泛化性和无功优化效果。
展开更多
关键词
无功优化
多智能体图强化学习
马尔可夫决策过程
图
卷积网络
配电网
在线阅读
下载PDF
职称材料
题名
SDWN中基于多智能体图强化学习的多对多通信路由方法
1
作者
文鹏
叶苗
王勇
何倩
仇洪冰
机构
桂林电子科技大学信息与通信学院
桂林电子科技大学广西无线宽带通信与信号处理重点实验室
桂林电子科技大学认知无线电与信息处理省部共建教育部重点实验室
桂林电子科技大学计算机与信息安全学院
出处
《电子学报》
北大核心
2025年第6期1885-1905,共21页
基金
国家自然科学基金(No.62161006,No.62372353)
广西无线宽带通信与信号处理重点实验室基金(桂科AD25069102)
+1 种基金
广西研究生教育创新计划基金(No.YCBZ2023134)
认知无线电与信息处理教育部重点实验室主任基金(No.CRKL220103)。
文摘
多对多通信路由问题是NP(Nondeterministic Polynomial time)难的组合优化问题,构建出高效的多对多通信路由路径还需及时获取全局网络状态信息以适应网络状态高度动态变化的特点.本文在软件定义无线网络(Software-Defined Wireless Networks,SDWN)场景中针对现有数据驱动的多智能体深度强化学习方法存在计算和部署成本高、难以适应非欧结构特点的网络拓扑的问题,并且训练过程中无效动作过多会增加存储空间和时间开销以及收敛速度慢,本文设计了一种SDN控制平面和数据平面进行协同感知与智能决策的新框架,并针对多对多通信路由问题设计了一种两阶段的多智能体路由方法(基于智能节点部署策略的多智能体图强化学习方法:MAGDS-M2M).为了降低在每个节点上都部署智能体所带来的计算和部署成本,设计了一种基于Q-学习的智能节点部署算法来确定需要部署智能体的网络节点;在完成多智能体部署后,在Actor-Critic(AC)框架下设计了一种基于多智能体图强化学习的多对多路由决策方法,基于图卷积网络(Graph Convolutional Networks,GCN)和图神经网络(Graph Neural Networks,GNN)重新设计Actor和Critic网络,解决了现有多智能体强化学习方法中卷积神经网络(Convolutional Neural Networks,CNN)对拓扑结构数据适应能力比较弱的问题;此外,为解决Actor网络固定长度的动作空间在训练过程中产生大量无效动作的问题,设计了一种新的动作空间局部观测方法.实验结果表明所提出的方法相比于基准实验降低了29.33%任务完成时延,并且验证了可以通过调节参数使任务完成的时延和各节点累计能耗标准差之间达到平衡.本文所做工作源代码已提交至开源平台https://github.com/GuetYe/MAGDS-M2M.
关键词
多对多通信
智能
节点部署
多智能体图强化学习
动作空间局部观测方法
软件定义无线网络
Keywords
many-to-many communication
intelligent node deployment
multi-agent graph reinforcement learning
action space local observation method
soft-ware-defined wireless networks
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于图强化学习的含光储配电网无功优化方法
被引量:
2
2
作者
全欢
胡建军
刘肇熙
谭科
祝敬华
陈逸凡
肖嘉睿
机构
华南理工大学电力学院
广东电网有限责任公司管理科学研究院
出处
《广东电力》
北大核心
2024年第12期79-86,共8页
基金
广东省基础与应用基础研究基金项目(2023A1515011171)
广东省新型电力系统技术创新研究项目(1690186045357)。
文摘
传统的无功优化方法已无法适应大规模分布式能源接入下的新型配电网,为了更好的应对含高比例新能源配电网的无功实时调度,提出一种基于图强化学习的配电网无功优化方法。首先,在分区分散式控制框架下根据配电网无功优化控制模型构造部分可观测马尔可夫决策过程。然后,提出基于物理信息强化学习范式的多智能体深度确定性策略梯度算法,通过图卷积神经网络挖掘拓扑结构的物理信息。随后,基于集中式训练-分散式执行的框架对马尔可夫决策过程进行求解,得到离线训练阶段的最优策略。最后,将训练好的模型在线应用,仿真结果表明所提方法能够有效应对电压波动和源荷不确定性,具有较好的实时性、泛化性和无功优化效果。
关键词
无功优化
多智能体图强化学习
马尔可夫决策过程
图
卷积网络
配电网
Keywords
reactive power optimization
multi-agent graph deep reinforcement learning
Markov decision process
graph convolutional network
distribution network
分类号
TM711 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
SDWN中基于多智能体图强化学习的多对多通信路由方法
文鹏
叶苗
王勇
何倩
仇洪冰
《电子学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于图强化学习的含光储配电网无功优化方法
全欢
胡建军
刘肇熙
谭科
祝敬华
陈逸凡
肖嘉睿
《广东电力》
北大核心
2024
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部