检索结果-维普期刊中文期刊服务平台

融合注意力机制与SAC算法的虚拟电厂多能流低碳调度被引量：5: 1; 作者俞晓荣徐青山 +1 位作者杜璞良王冬《电力工程技术》北大核心 2024年第5期233-246,共14页; 虚拟电厂(virtual power plant,VPP)作为多能流互联的综合能源网络,已成为中国加速实现双碳目标的重要角色。但VPP内部资源协同低碳调度面临多能流的耦合程度紧密、传统碳交易模型参数主观性强、含高维动态参数的优化目标在线求解困难... 展开更多; 关键词虚拟电厂(VPP) 多能流改进碳交易机制深度强化学习注意力机制(AM) 柔性动作评价(sac)算法; 在线阅读下载PDF 职称材料

基于SAC深度强化学习算法的充电枪寻孔策略研究: 2; 作者徐建明陈阜董建伟《高技术通讯》 CAS 2023年第1期63-71,共9页; 针对机器人自动化充电任务中的寻孔操作,研究基于柔性行动者评价者(SAC)深度强化学习算法的机器人寻孔策略。设计一个基于actor-critic框架、以枪头位姿、接触力信息为输入、末端枪头坐标系XY平面动作为输出的策略控制器。该策略控制器... 展开更多; 关键词机器人寻孔深度强化学习柔性行动者评价者(sac)算法神经网络力控制; 在线阅读下载PDF 职称材料

LoRa网络中基于深度强化学习的信息年龄优化: 3; 作者程克非陈彩蝶 +1 位作者罗佳陈前斌《电子与信息学报》北大核心 2025年第2期541-550,共10页; 信息年龄(AoI)是信息新鲜度的衡量指标,针对时间敏感的物联网,最小化AoI显得尤为重要。该文基于LoRa网络的智能交通环境,分析Slot-Aloha协议下的AoI优化策略,建立了Slot-Aloha协议下数据包之间传输碰撞和等待时间的系统模型。通过分析指... 展开更多; 关键词信息年龄 LoRa 柔性动作-评价算法深度强化学习优化策略; 在线阅读下载PDF 职称材料

基于计算重用的无人机辅助边缘计算系统能耗优化被引量：2: 4; 作者李斌蔡海晨 +1 位作者赵传信王俊义《电子与信息学报》 EI CAS CSCD 北大核心 2024年第7期2740-2747,共8页; 针对复杂地形下时延敏感任务对终端用户的计算需求激增问题,该文提出一种无人机(UAV)辅助的移动边缘计算可重用任务的协同计算卸载方案。首先,通过联合优化用户卸载策略、用户传输功率、无人机上服务器分配、用户设备的计算频率和无人... 展开更多; 关键词无人机移动边缘计算计算重用资源分配柔性动作-评价算法; 在线阅读下载PDF 职称材料

题名融合注意力机制与SAC算法的虚拟电厂多能流低碳调度被引量：5: 1; 作者俞晓荣徐青山杜璞良王冬; 机构国网江苏省电力有限公司泰州供电分公司东南大学电气工程学院上海电力大学经济与管理学院; 出处《电力工程技术》北大核心 2024年第5期233-246,共14页; 基金江苏省重点研发计划资助项目“基于物联网融合的用能互联网运行与交易应用科技示范”(BE2020688)。; 文摘虚拟电厂(virtual power plant,VPP)作为多能流互联的综合能源网络,已成为中国加速实现双碳目标的重要角色。但VPP内部资源协同低碳调度面临多能流的耦合程度紧密、传统碳交易模型参数主观性强、含高维动态参数的优化目标在线求解困难等问题。针对这些问题,文中提出一种融合注意力机制(attention mechanism,AM)与柔性动作评价(soft actor-critic,SAC)算法的VPP多能流低碳调度方法。首先,根据VPP的随机碳流特性,面向动态参数建立基于贝叶斯优化的改进阶梯型碳交易机制。接着,以经济效益和碳排放量为目标函数构建含氢VPP多能流解耦模型。然后,考虑到该模型具有高维非线性与权重参数实时更新的特征,利用融合AM的改进SAC深度强化学习算法在连续动作空间对模型进行求解。最后,对多能流调度结果进行仿真分析和对比实验,验证了文中方法的可行性及其相较于原SAC算法较高的决策准确性。; 关键词虚拟电厂(VPP) 多能流改进碳交易机制深度强化学习注意力机制(AM) 柔性动作评价(sac)算法; Keywords virtual power plant(VPP) multi-energy flow improved carbon trading mechanism deep reinforcement learning attention mechanism(AM) soft actor-critic(sac)algorithm; 分类号 TM732 [电气工程—电力系统及自动化]; 在线阅读下载PDF 职称材料

题名基于SAC深度强化学习算法的充电枪寻孔策略研究: 2; 作者徐建明陈阜董建伟; 机构浙江工业大学信息工程学院; 出处《高技术通讯》 CAS 2023年第1期63-71,共9页; 基金国家自然科学基金-浙江省自然科学基金联合基金两化融合项目(U1709213) 国家自然科学基金面上项目(61374103)资助。; 文摘针对机器人自动化充电任务中的寻孔操作,研究基于柔性行动者评价者(SAC)深度强化学习算法的机器人寻孔策略。设计一个基于actor-critic框架、以枪头位姿、接触力信息为输入、末端枪头坐标系XY平面动作为输出的策略控制器。该策略控制器共有5个神经网络,分别为actor网络、2个目标critic网络、2个critic网络;actor网络负责输出寻孔动作,目标critic网络负责输出下一寻孔状态下寻孔动作的价值评估,critic网络负责输出当前寻孔状态下寻孔动作的价值评估。基于double-Q trick方法使用2个目标critic网络输出价值中的较小值和2个critic网络输出价值中的较小值来分别更新critic网络和actor网络,以训练策略控制器。采用力位混合控制结构,将actor网络输出的XY平面位移动作转换成期望平动速度,与Z轴力跟踪导纳控制输出的期望速度合成机器人期望速度引导充电枪寻孔。仿真和实验验证了所提方法的有效性。; 关键词机器人寻孔深度强化学习柔性行动者评价者(sac)算法神经网络力控制; Keywords robot hole searching deep reinforcement learning soft actor-critic(sac) neural network force control; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP242 [自动化与计算机技术—检测技术与自动化装置] U491.8 [交通运输工程—交通运输规划与管理]; 在线阅读下载PDF 职称材料

题名LoRa网络中基于深度强化学习的信息年龄优化: 3; 作者程克非陈彩蝶罗佳陈前斌; 机构重庆邮电大学网络空间安全与信息法学院重庆邮电大学通信与信息工程学院移动通信技术重点实验室; 出处《电子与信息学报》北大核心 2025年第2期541-550,共10页; 基金重庆市教委科学技术研究项目(KJQN202400643)。; 文摘信息年龄(AoI)是信息新鲜度的衡量指标,针对时间敏感的物联网,最小化AoI显得尤为重要。该文基于LoRa网络的智能交通环境,分析Slot-Aloha协议下的AoI优化策略,建立了Slot-Aloha协议下数据包之间传输碰撞和等待时间的系统模型。通过分析指出,在LoRa上行传输过程中,随着数据包数量增多,AoI主要受到数据包碰撞影响。为克服优化问题中动作空间过大导致难以实现有效求解的问题,该文采用连续动作空间映射离散动作空间的方式,使用柔性动作-评价(SAC)算法对LoRa网络下的AoI进行优化。仿真结果显示,SAC算法优于传统算法与传统深度强化学习算法,可有效降低网络的平均AoI。; 关键词信息年龄 LoRa 柔性动作-评价算法深度强化学习优化策略; Keywords Age of Information(AoI) LoRa Soft Actor-Critic algorithm(sac) Deep reinforcement learning Optimization strategy; 分类号 TN929.5 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名基于计算重用的无人机辅助边缘计算系统能耗优化被引量：2: 4; 作者李斌蔡海晨赵传信王俊义; 机构南京信息工程大学计算机学院安徽师范大学计算机与信息学院桂林电子科技大学信息与通信学院; 出处《电子与信息学报》 EI CAS CSCD 北大核心 2024年第7期2740-2747,共8页; 基金国家自然科学基金(62101277,62371149) 认知无线电与信息处理教育部重点实验室基金(CRKL230203)。; 文摘针对复杂地形下时延敏感任务对终端用户的计算需求激增问题,该文提出一种无人机(UAV)辅助的移动边缘计算可重用任务的协同计算卸载方案。首先,通过联合优化用户卸载策略、用户传输功率、无人机上服务器分配、用户设备的计算频率和无人机服务器的计算频率以及无人机的飞行轨迹,构建满足时延约束下最小化系统平均总能耗的系统模型。其次,通过深度强化学习求解该优化问题,并提出了基于柔性动作-评价(SAC)的优化算法。该算法采用最大熵的策略来鼓励探索,以增强算法的探索能力并加快训练的收敛速度。仿真结果表明,基于SAC的算法能有效降低系统的平均总能耗,并具有较好的收敛性。; 关键词无人机移动边缘计算计算重用资源分配柔性动作-评价算法; Keywords Unmanned Aerial Vehicle(UAV) Mobile edge computing Reusable tasks Resource allocation Soft Actor-Critic(sac)algorithm; 分类号 TN929.5 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	融合注意力机制与SAC算法的虚拟电厂多能流低碳调度	俞晓荣徐青山杜璞良王冬	《电力工程技术》北大核心	2024	5	在线阅读下载PDF 职称材料
2	基于SAC深度强化学习算法的充电枪寻孔策略研究	徐建明陈阜董建伟	《高技术通讯》 CAS	2023	0	在线阅读下载PDF 职称材料
3	LoRa网络中基于深度强化学习的信息年龄优化	程克非陈彩蝶罗佳陈前斌	《电子与信息学报》北大核心	2025	0	在线阅读下载PDF 职称材料
4	基于计算重用的无人机辅助边缘计算系统能耗优化	李斌蔡海晨赵传信王俊义	《电子与信息学报》 EI CAS CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料