期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
二人零和博弈情形下基于Dueling DQN的火力分配方法
1
作者 邱少明 黄昕晨 +1 位作者 刘良玉 俄必聪 《兵器装备工程学报》 北大核心 2025年第5期67-76,共10页
针对火力分配决策维度高,并且参战各方都有不同的战略目标,各方存在着相互耦合、复杂的作用关系,战场态势瞬息万变,传统DQN算法收敛速度慢的问题,提出一种基于Dueling DQN与博弈论相结合的火力分配优化方法。首先,构建二人零和博弈状态... 针对火力分配决策维度高,并且参战各方都有不同的战略目标,各方存在着相互耦合、复杂的作用关系,战场态势瞬息万变,传统DQN算法收敛速度慢的问题,提出一种基于Dueling DQN与博弈论相结合的火力分配优化方法。首先,构建二人零和博弈状态下的火力分配模型。其次,建立了同时为对抗双方进行火力分配决策的Dueling DQN算法框架,提出ε-Nash-Boltzmann策略选取动作,以敌我双方的期望收益差作为奖励函数。实验结果表明,该算法能根据战场状态以最快速度求解得到保卫我方目标的最佳策略,具备在博弈情形下求解高维度的火力分配问题的优势。 展开更多
关键词 火力分配 二人零和博弈 Dueling DQN 纳什均衡
在线阅读 下载PDF
具有未知动态的线性系统二人零和博弈问题在线学习方案 被引量:2
2
作者 富月 柴天佑 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第2期196-201,共6页
针对具有未知动态线性系统的二人零和博弈问题,本文提出了一种新的基于单环迭代方法的在线学习方案.为保证单环迭代方法的收敛性,给出了一种新的分析方法.在系统内部矩阵A,控制输入矩阵B以及干扰输入矩阵D均未知的情况下,通过在线迭代策... 针对具有未知动态线性系统的二人零和博弈问题,本文提出了一种新的基于单环迭代方法的在线学习方案.为保证单环迭代方法的收敛性,给出了一种新的分析方法.在系统内部矩阵A,控制输入矩阵B以及干扰输入矩阵D均未知的情况下,通过在线迭代策略,同步得到了博弈代数黎卡提方程的近似解,以及控制和干扰策略.仿真结果表明了所提方法的有效性. 展开更多
关键词 二人零和博弈 策略迭代 博弈代数黎卡提方程
在线阅读 下载PDF
含复合储能微电网的多目标优化运行 被引量:10
3
作者 许志荣 杨苹 温剑威 《现代电力》 北大核心 2016年第2期1-5,共5页
针对包含光伏、液流电池和锂电池的并网型复合储能微电网,提出一种基于二人零和博弈权重系数法的多目标优化方法。为实现微电网可再生能源利用最大化、并网运行冲击最小,本文以微电网购电费用和联络线功率波动两者最小为目标建立多目标... 针对包含光伏、液流电池和锂电池的并网型复合储能微电网,提出一种基于二人零和博弈权重系数法的多目标优化方法。为实现微电网可再生能源利用最大化、并网运行冲击最小,本文以微电网购电费用和联络线功率波动两者最小为目标建立多目标优化模型。为兼顾各个目标,提出基于二人零和博弈的加权系数法将该模型转化为单目标优化问题进行求解。根据一个实际微电网进行算例验证,结果表明该优化方法可有效提高微电网运行经济性,并有效减少联络线功率波动。 展开更多
关键词 微电网 复合储能 多目标优化 二人零和博弈
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部