随着我国电力市场改革的进行,市场中逐渐出现越来越多的发售电一体化集团。这些集团的成员包含发电商和售电商,其资产构成具有关联重叠性,在实际电力市场运行过程中,成员之间既存在竞争也存在合作关系。针对这一现象,该文首先基于轻微...随着我国电力市场改革的进行,市场中逐渐出现越来越多的发售电一体化集团。这些集团的成员包含发电商和售电商,其资产构成具有关联重叠性,在实际电力市场运行过程中,成员之间既存在竞争也存在合作关系。针对这一现象,该文首先基于轻微利他理论建立一种针对发售电一体化集团成员合谋模型。其次,在此基础上,构建多智能体深度双Q网络算法(multi-agent double deep Q-network,MA-DDQN)模拟不完全信息情况下的发售电一体化集团成员的报价行为。通过模拟仿真,研究在重复投标竞争过程中,发售电一体化集团成员的报价行为与轻微利他模型中发电侧和售电侧利他因子间的关系,考察不同成员利他属性对合谋策略的影响,该文的研究成果对于市场监管者分析集中交易模式市场运营中发/售电商的合谋动机具有指导意义。展开更多
不完全信息的电力市场环境下发电商仅知道自身相关的信息,而其他市场参与者的报价和市场环境都可能会影响市场出清结果,进而影响发电商的收益,因此其报价决策应当考虑多维的市场信息。基于深度强化学习算法,提出多智能体的DDQN(double d...不完全信息的电力市场环境下发电商仅知道自身相关的信息,而其他市场参与者的报价和市场环境都可能会影响市场出清结果,进而影响发电商的收益,因此其报价决策应当考虑多维的市场信息。基于深度强化学习算法,提出多智能体的DDQN(double deep Q-network)算法模拟日前现货市场中发电商三段式竞价策略的过程。首先,定义发电商模型中马尔可夫决策过程的要素和动作价值函数;然后,建立发电商深度双Q网络的框架,并引入经验池和动态ε-greedy算法进行神经网络的训练,该决策模型可以根据市场的出清电价和负荷水平等多维连续状态做出报价;最后,通过算例比较了发电商采用DDQN和传统Qlearning两种算法获得的收益差别,说明DDQN算法可以根据发电商面临的复杂市场环境做出正确的决策而Q-learning算法在环境复杂时决策能力较差,并在不同状态量选取、网络泛化能力、更大规模算例适应性等方面分析了发电商采用DDQN算法进行市场策略生成的有效性和优越性。展开更多
文摘随着我国电力市场改革的进行,市场中逐渐出现越来越多的发售电一体化集团。这些集团的成员包含发电商和售电商,其资产构成具有关联重叠性,在实际电力市场运行过程中,成员之间既存在竞争也存在合作关系。针对这一现象,该文首先基于轻微利他理论建立一种针对发售电一体化集团成员合谋模型。其次,在此基础上,构建多智能体深度双Q网络算法(multi-agent double deep Q-network,MA-DDQN)模拟不完全信息情况下的发售电一体化集团成员的报价行为。通过模拟仿真,研究在重复投标竞争过程中,发售电一体化集团成员的报价行为与轻微利他模型中发电侧和售电侧利他因子间的关系,考察不同成员利他属性对合谋策略的影响,该文的研究成果对于市场监管者分析集中交易模式市场运营中发/售电商的合谋动机具有指导意义。
文摘不完全信息的电力市场环境下发电商仅知道自身相关的信息,而其他市场参与者的报价和市场环境都可能会影响市场出清结果,进而影响发电商的收益,因此其报价决策应当考虑多维的市场信息。基于深度强化学习算法,提出多智能体的DDQN(double deep Q-network)算法模拟日前现货市场中发电商三段式竞价策略的过程。首先,定义发电商模型中马尔可夫决策过程的要素和动作价值函数;然后,建立发电商深度双Q网络的框架,并引入经验池和动态ε-greedy算法进行神经网络的训练,该决策模型可以根据市场的出清电价和负荷水平等多维连续状态做出报价;最后,通过算例比较了发电商采用DDQN和传统Qlearning两种算法获得的收益差别,说明DDQN算法可以根据发电商面临的复杂市场环境做出正确的决策而Q-learning算法在环境复杂时决策能力较差,并在不同状态量选取、网络泛化能力、更大规模算例适应性等方面分析了发电商采用DDQN算法进行市场策略生成的有效性和优越性。