检索结果-维普期刊中文期刊服务平台

基于多代理强化学习的多新型市场主体虚拟电厂博弈竞价及效益分配策略被引量：8: 1; 作者张继行张一 +2 位作者王旭蒋传文王玲玲《电网技术》 EI CSCD 北大核心 2024年第5期1980-1991,I0052,I0053,共14页; 目前新型市场主体规模较小但数量众多,为提高竞争力可以使其组成联盟以多新型市场主体虚拟电厂的形式参与市场博弈,而公平的效益分配方法是维持联盟稳定的基础。为此,该文提出了一种多新型市场主体虚拟电厂博弈竞价及效益分配策略。首先... 展开更多; 关键词虚拟电厂主辅联合市场多代理强化学习最优联盟结构夏普利值; 在线阅读下载PDF 职称材料

基于多代理深度强化学习的战术无线网络安全路由算法研究: 2; 作者谢英辉刘亮《传感技术学报》北大核心 2025年第8期1482-1490,共9页; 由于应用场景的特殊性,战术无线网络更易遭受干扰攻击,这破坏了数据通信,阻碍了数据包的传输。为此,提出基于多代理深度强化学习的安全路由(Multi-agent Deep Reinforcement Learning-based Secure Routing,MRSR)。MRSR路由将节点作为代... 展开更多; 关键词战术无线网络安全路由干扰攻击多代理深度强化学习奖励函数; 在线阅读下载PDF 职称材料

基于多代理强化学习的结构拆解资源化评估及决策优化: 3; 作者刘伯达杨彬 +1 位作者肖建庄李进军《同济大学学报(自然科学版)》 2025年第9期1372-1381,共10页; 针对老旧结构构件拆解施工过程,通过资源流动约束、柔性工作分解和选择性拆解策略建立了拆解工序计划数学模型,并提出了一个以回收效率为目标的多代理强化学习拆解方案优化方法。案例应用结果表明,与遗传算法相比,该方法具有更高的碳排... 展开更多; 关键词结构资源化多代理强化学习结构拆解决策优化; 在线阅读下载PDF 职称材料

多代理最优响应Q学习及收敛性证明被引量：1: 4; 作者张化祥黄上腾《计算机科学》 CSCD 北大核心 2004年第4期96-98,共3页; 在分析了多代理强化学习的基础上,提出了一种基于对手策略假设的代理最优响应强化学习规则,并证明了当对手策略满足一定条件时,基于该学习规则的Q值收敛。实验结果与理论证明相一致。; 关键词学习规则 Q学习强化学习收敛性证明多代理强化学习学习算法人工智能; 在线阅读下载PDF 职称材料

基于先验知识图谱的多代理被遮挡目标类别推理模型: 5; 作者荣欢钱敏峰 +1 位作者马廷淮孙圣杰《计算机科学》 CSCD 北大核心 2023年第1期243-252,共10页; 目标检测(Object Detection)是计算机视觉中最为热门的方向之一,在军事、医疗等重要领域都有广泛运用。然而,大多数目标检测模型都只能对可见物体进行识别,日常生活中的图片往往存在被遮挡(不可见)的目标物体,现有目标检测模型对图片中... 展开更多; 关键词知识图谱推理图片目标检测多代理强化学习 DDPG; 在线阅读下载PDF 职称材料

题名基于多代理强化学习的多新型市场主体虚拟电厂博弈竞价及效益分配策略被引量：8: 1; 作者张继行张一王旭蒋传文王玲玲; 机构电力传输与功率变换控制教育部重点实验室(上海交通大学) 雅砻江流域水电开发有限公司; 出处《电网技术》 EI CSCD 北大核心 2024年第5期1980-1991,I0052,I0053,共14页; 基金国家自然科学基金项目(52277110) 上海市“科技创新行动计划”软科学研究青年项目(23692119500) 内蒙古自治区“揭榜挂帅”项目(2022JBGS0043)。; 文摘目前新型市场主体规模较小但数量众多,为提高竞争力可以使其组成联盟以多新型市场主体虚拟电厂的形式参与市场博弈,而公平的效益分配方法是维持联盟稳定的基础。为此,该文提出了一种多新型市场主体虚拟电厂博弈竞价及效益分配策略。首先,考虑多新型市场主体虚拟电厂和传统机组均作为价格影响者,构建包含电能量和备用辅助服务的主辅联合市场交易模型,并在不完全信息市场环境下采用多代理强化学习(multi-agentreinforcementlearning,MADDPG)算法求解。其次,采用分布式联盟构造方法得到最优多新型市场主体联盟结构。为解决效益分配方法中的维数灾问题,引入蒙特卡洛近似夏普利值,对虚拟电厂内各新型市场主体的超额收益进行合理分配。最后,算例分析表明所提方法给出了多新型主体虚拟电厂参与主辅联合市场的最优联盟结构和竞价策略,在保证精度的前提下提高了超额收益分配的计算速度,与单独参与市场相比提高了所有新型市场主体的收益。; 关键词虚拟电厂主辅联合市场多代理强化学习最优联盟结构夏普利值; Keywords virtual power plant joint energy and auxiliary services market multi-agent reinforcement learning optimal alliance structure Shapley value; 分类号 TM721 [电气工程—电力系统及自动化]; 在线阅读下载PDF 职称材料

题名基于多代理深度强化学习的战术无线网络安全路由算法研究: 2; 作者谢英辉刘亮; 机构长沙民政职业技术学院软件学院; 出处《传感技术学报》北大核心 2025年第8期1482-1490,共9页; 基金教育部教育科学研究基地项目(2021ITA10023) 中国高校产学研创新基金新一代信息技术创新项目(2020ITA03043) +1 种基金长沙市自科基金项目(kq2208240)。; 文摘由于应用场景的特殊性,战术无线网络更易遭受干扰攻击,这破坏了数据通信,阻碍了数据包的传输。为此,提出基于多代理深度强化学习的安全路由(Multi-agent Deep Reinforcement Learning-based Secure Routing,MRSR)。MRSR路由将节点作为代理,它们通过深度神经网络学习决策路由。将跳数、一跳时延、数据包丢失率和能量消耗信息关联到奖励函数,使得代理能够选择时延低、可靠性高的转发节点,进而克服干扰攻击。仿真结果表明,提出的MRSR路由提高了数据包传递率和能量效率。; 关键词战术无线网络安全路由干扰攻击多代理深度强化学习奖励函数; Keywords tactical wireless sensor networks secure routing jamming attacks multi-agent deep reinforcement learning reward function; 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于多代理强化学习的结构拆解资源化评估及决策优化: 3; 作者刘伯达杨彬肖建庄李进军; 机构同济大学土木工程学院; 出处《同济大学学报(自然科学版)》 2025年第9期1372-1381,共10页; 基金国家重点研发计划(2024YFD1600402)。; 文摘针对老旧结构构件拆解施工过程,通过资源流动约束、柔性工作分解和选择性拆解策略建立了拆解工序计划数学模型,并提出了一个以回收效率为目标的多代理强化学习拆解方案优化方法。案例应用结果表明,与遗传算法相比,该方法具有更高的碳排放回报/消耗比,验证了基于智能算法优化的拆解方案对节能减碳的有效性。; 关键词结构资源化多代理强化学习结构拆解决策优化; Keywords structural resource utilization multi-agent reinforcement learning structural deconstruction decision optimization; 分类号 TV51 [水利工程] TQ340.68 [水利工程—水利水电工程]; 在线阅读下载PDF 职称材料

题名多代理最优响应Q学习及收敛性证明被引量：1: 4; 作者张化祥黄上腾; 机构上海交通大学计算机科学与工程系; 出处《计算机科学》 CSCD 北大核心 2004年第4期96-98,共3页; 文摘在分析了多代理强化学习的基础上,提出了一种基于对手策略假设的代理最优响应强化学习规则,并证明了当对手策略满足一定条件时,基于该学习规则的Q值收敛。实验结果与理论证明相一致。; 关键词学习规则 Q学习强化学习收敛性证明多代理强化学习学习算法人工智能; Keywords Reinforcement learning, Markov games, Convergence; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于先验知识图谱的多代理被遮挡目标类别推理模型: 5; 作者荣欢钱敏峰马廷淮孙圣杰; 机构南京信息工程大学人工智能学院(未来技术学院) 南京信息工程大学计算机学院、网络安全学院; 出处《计算机科学》 CSCD 北大核心 2023年第1期243-252,共10页; 基金国家自然科学基金(62102187) 江苏省自然科学基金(基础研究计划)(BK20210639) 国家重点研发计划(2021YFE0104400)。; 文摘目标检测(Object Detection)是计算机视觉中最为热门的方向之一,在军事、医疗等重要领域都有广泛运用。然而,大多数目标检测模型都只能对可见物体进行识别,日常生活中的图片往往存在被遮挡(不可见)的目标物体,现有目标检测模型对图片中的被遮挡目标难以表现出较理想的检测性能。为此,文中提出了一种基于图库先验知识图谱的多代理协作式图片被遮挡目标类别推理模型(IMG-KGR-MAC)。具体而言,1)IMG-KGR-MAC根据给定图库中所有图片的可见目标及其之间的位置关系构建全局先验知识图谱;同时,根据图片自身所含目标及其位置关系,为各图片分别建立图片知识图谱;各图片内被遮挡目标的信息均不计入全局先验知识图谱和图片自身知识图谱;2)采用DDPG(Deep Deterministic Policy Gradient)深度强化学习思想,构建两个相互协作的代理;代理1根据当前图片语义信息从全局先验知识图谱挑选出与被遮挡目标最为适配的“类别标签”,将其作为新实体节点加入到给定图片自身的知识图谱中;代理2根据代理1新加入的实体,从全局先验知识图谱中进一步挑选〈实体,关系〉,扩展与新实体节点相关联的图谱结构;3)代理1与代理2通过共享任务环境和在奖励值上建立通信,相互协作地按“图片被遮挡目标(实体)→关联图谱结构”以及“关联图谱结构→图片被遮挡目标(实体)”原理,开展正向与反向推理,从而有效估计出给定图片被遮挡目标最为可能的类别标签。实验结果表明,与现有相关方法相比,所提出的IMG-KGR-MAC模型可以学习到给定图片被遮挡目标与全局先验知识图谱之间的语义关系,有效克服了现有模型对被遮挡目标难以检测的弊端,对于被遮挡目标有良好的推理能力,在MR(Mean Rank)以及mAP(Mean Average Precision)等多项指标上都有超过20%的提升。; 关键词知识图谱推理图片目标检测多代理强化学习 DDPG; Keywords Knowledge graph reasoning Image object detection Multi-agent Reinforcement Learning DDPG; 分类号 TP319.1 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于多代理强化学习的多新型市场主体虚拟电厂博弈竞价及效益分配策略	张继行张一王旭蒋传文王玲玲	《电网技术》 EI CSCD 北大核心	2024	8	在线阅读下载PDF 职称材料
2	基于多代理深度强化学习的战术无线网络安全路由算法研究	谢英辉刘亮	《传感技术学报》北大核心	2025	0	在线阅读下载PDF 职称材料
3	基于多代理强化学习的结构拆解资源化评估及决策优化	刘伯达杨彬肖建庄李进军	《同济大学学报(自然科学版)》	2025		在线阅读下载PDF 职称材料
4	多代理最优响应Q学习及收敛性证明	张化祥黄上腾	《计算机科学》 CSCD 北大核心	2004	1	在线阅读下载PDF 职称材料
5	基于先验知识图谱的多代理被遮挡目标类别推理模型	荣欢钱敏峰马廷淮孙圣杰	《计算机科学》 CSCD 北大核心	2023	0	在线阅读下载PDF 职称材料