检索结果-维普期刊中文期刊服务平台

基于双深度Q网络算法的无人机辅助密集网络资源优化策略: 1; 作者陈佳美孙慧雯 +2 位作者李玉峰王宇鹏别玉霞《电子与信息学报》北大核心 2025年第8期2621-2629,共9页; 为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架... 展开更多; 关键词空地密集网络半分布式双深度q网络算法资源优化; 在线阅读下载PDF 职称材料

基于双深度Q网络算法的多用户端对端能源共享机制研究: 2; 作者武东昊王国烽 +2 位作者毛毳陈玉萍张有兵《高技术通讯》 CAS 北大核心 2024年第7期755-764,共10页; 端对端(P2P)电力交易作为用户侧能源市场的一种新的能源平衡和互动方式,可以有效促进用户群体内的能源共享,提高参与能源市场用户的经济效益。然而传统求解用户间P2P交易的方法依赖对于光伏、负荷数据的预测,难以实时响应用户间的源荷... 展开更多; 关键词端对端(P2P)能源共享强化学习(RL) 能源交易市场双深度q网络(DDqN)算法; 在线阅读下载PDF 职称材料

基于协作式深度强化学习的火灾应急疏散仿真研究被引量：7: 3; 作者倪凌佳黄晓霞 +1 位作者李红旮张子博《系统仿真学报》 CAS CSCD 北大核心 2022年第6期1353-1366,共14页; 火灾是威胁公共安全的主要灾害之一,火灾产生的高温和有毒有害烟气严重影响了疏散路径的选择。将深度强化学习引入到应急疏散仿真研究,针对多智能体环境提出了协作式双深度Q网络算法。建立随时间动态变化的火灾场景模型,为人员疏散提供... 展开更多; 关键词协作式双深度q网络算法深度强化学习多智能体系统应急疏散仿真火灾场景仿真; 在线阅读下载PDF 职称材料

基于深度强化学习和隐私保护的群智感知动态任务分配策略: 4; 作者傅彦铭陆盛林 +1 位作者陈嘉元覃华《信息网络安全》 CSCD 北大核心 2024年第3期449-461,共13页; 在移动群智感知(Mobile Crowd Sensing,MCS)中,动态任务分配的结果对提高系统效率和确保数据质量至关重要。然而,现有的大部分研究在处理动态任务分配时,通常将其简化为二分匹配模型,该简化模型未充分考虑任务属性与工人属性对匹配结果... 展开更多; 关键词群智感知深度强化学习隐私保护双深度q网络能力阈值贪婪算法; 在线阅读下载PDF 职称材料

基于深度强化学习的增程式电动轻卡能量管理策略被引量：4: 5; 作者段龙锦王贵勇 +1 位作者王伟超何述超《内燃机工程》 CAS CSCD 北大核心 2023年第6期90-99,共10页; 为了解决增程式电动轻卡辅助动力单元(auxiliary power units,APU)和动力电池之间能量的合理分配问题,在Simulink中建立面向控制的仿真模型,并提出一种基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,T... 展开更多; 关键词深度q网络深度确定性策略梯度双延迟深度确定性策略梯度算法增程式电动轻卡; 在线阅读下载PDF 职称材料

考虑燃油消耗异质性的船舶进港效率与能耗协同优化: 6; 作者郭文强张新宇杨嵩旭《交通运输系统工程与信息》北大核心 2025年第4期297-305,共9页; 针对不同类型船舶在进港过程中燃油消耗差异显著,调度效率与能耗优化难以兼顾的问题,本文研究考虑燃油消耗异质性的船舶进港效率与能耗协同优化方法,构建以最小化船舶总进港时间与总燃油消耗为目标的双目标混合整数非线性规划模型,提出... 展开更多; 关键词水路运输效率和油耗优化深度q网络进港船舶双种群协作框架; 在线阅读下载PDF 职称材料

基于深度强化学习的节能工艺路线发现方法被引量：2: 7; 作者陶鑫钰王艳纪志成《智能系统学报》 CSCD 北大核心 2023年第1期23-35,共13页; 由于传统基于固定加工环境的工艺路线制定规则,无法快速响应加工环境的动态变化制定节能工艺路线。因此提出了基于深度Q网络(deep Q network,DQN)的节能工艺路线发现方法。基于马尔可夫决策过程,定义状态向量、动作空间、奖励函数,建立... 展开更多; 关键词深度强化学习深度q网络动态加工环境工艺路线马尔可夫决策过程智能体决策双q网络启发式算法; 在线阅读下载PDF 职称材料

题名基于双深度Q网络算法的无人机辅助密集网络资源优化策略: 1; 作者陈佳美孙慧雯李玉峰王宇鹏别玉霞; 机构沈阳航空航天大学电子与信息工程学院; 出处《电子与信息学报》北大核心 2025年第8期2621-2629,共9页; 基金国家自然科学基金(61501306) 辽宁省教育厅基金(LJKMZ20220519,LJKMZ0220526) +1 种基金学校科研基金(2019-1-ZZLX-07)。; 文摘为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架。在此基础上,针对传统完全集中式方案存在的计算负担重、响应速度慢以及分布式方案缺乏全局优化视角等问题,提出一种半分布式的双深度Q网络(DDQN)功率控制方案。该方案旨在优化网络能效,通过分布式决策与集中训练相结合的方式,有效平衡了计算复杂度和性能优化。具体而言,半分布式方案利用DDQN算法在基站侧进行分布式决策,同时引入集中式网络训练器以确保整体网络的能效最优。仿真结果表明,所提出的半分布式DDQN方案能够很好地适应密集复杂网络结构,与传统深度Q网络(DQN)相比,在能效和总吞吐量方面均取得了显著提升。; 关键词空地密集网络半分布式双深度q网络算法资源优化; Keywords Air–ground dense network Semi-distributed Double Deep q Network(DDqN)algorithm Resource optimization; 分类号 TN92 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名基于双深度Q网络算法的多用户端对端能源共享机制研究: 2; 作者武东昊王国烽毛毳陈玉萍张有兵; 机构浙江工业大学信息工程学院浙江华云电力工程设计咨询有限公司; 出处《高技术通讯》 CAS 北大核心 2024年第7期755-764,共10页; 基金国家自然科学基金(U22B20116)资助项目。; 文摘端对端(P2P)电力交易作为用户侧能源市场的一种新的能源平衡和互动方式,可以有效促进用户群体内的能源共享,提高参与能源市场用户的经济效益。然而传统求解用户间P2P交易的方法依赖对于光伏、负荷数据的预测,难以实时响应用户间的源荷变动问题。为此,本文建立了一种以多类型用户为基础的多用户P2P能源社区交易模型,并引入基于双深度Q网络(DDQN)的强化学习(RL)算法对其进行求解。所提方法通过DDQN算法中的预测网络以及目标网络读取多用户P2P能源社区中的环境信息,训练后的神经网络可通过实时的光伏、负荷以及电价数据对当前社区内的多用户P2P交易问题进行求解。案例仿真结果表明,所提方法在促进社区内用户间P2P能源交易共享的同时,保证了多用户P2P能源社区的经济性。; 关键词端对端(P2P)能源共享强化学习(RL) 能源交易市场双深度q网络(DDqN)算法; Keywords peer-to-peer(P2P)energy sharing reinforcement learning(RL) energy trading market double deep q network(DDqN); 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于协作式深度强化学习的火灾应急疏散仿真研究被引量：7: 3; 作者倪凌佳黄晓霞李红旮张子博; 机构中国科学院空天信息创新研究院中国科学院大学自然资源部城市国土资源监测与仿真重点实验室; 出处《系统仿真学报》 CAS CSCD 北大核心 2022年第6期1353-1366,共14页; 基金国家自然科学基金(41971363) 自然资源部城市国土资源监测与仿真重点实验室开放基金资助课题(KF-2018-03-032) 国家重点研发计划(2017YFB0503905)。; 文摘火灾是威胁公共安全的主要灾害之一,火灾产生的高温和有毒有害烟气严重影响了疏散路径的选择。将深度强化学习引入到应急疏散仿真研究,针对多智能体环境提出了协作式双深度Q网络算法。建立随时间动态变化的火灾场景模型,为人员疏散提供实时的危险区域分布信息;对各自独立的智能体神经网络进行整合,建立多智能体统一的深度神经网络,实现所有智能体之间的神经网络和经验共享,提高整体协作疏散效率。结果表明:所提方法具有良好的稳定性和适应性,训练和学习效率得到提升,具有良好的应用价值。; 关键词协作式双深度q网络算法深度强化学习多智能体系统应急疏散仿真火灾场景仿真; Keywords cooperative double deep q network algorithm deep reinforcement learning multi-agent system emergency evacuation simulation fire scenario simulation; 分类号 TP391.9 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于深度强化学习和隐私保护的群智感知动态任务分配策略: 4; 作者傅彦铭陆盛林陈嘉元覃华; 机构广西大学计算机与电子信息学院广西高校并行分布与智能计算重点实验室广西智能数字服务工程技术研究中心; 出处《信息网络安全》 CSCD 北大核心 2024年第3期449-461,共13页; 基金国家自然科学基金[61962005]。; 文摘在移动群智感知(Mobile Crowd Sensing,MCS)中,动态任务分配的结果对提高系统效率和确保数据质量至关重要。然而,现有的大部分研究在处理动态任务分配时,通常将其简化为二分匹配模型,该简化模型未充分考虑任务属性与工人属性对匹配结果的影响,同时忽视了工人位置隐私的保护问题。针对这些不足,文章提出一种基于深度强化学习和隐私保护的群智感知动态任务分配策略。该策略首先通过差分隐私技术为工人位置添加噪声,保护工人隐私;然后利用深度强化学习方法自适应地调整任务批量分配;最后使用基于工人任务执行能力阈值的贪婪算法计算最优策略下的平台总效用。在真实数据集上的实验结果表明,该策略在不同参数设置下均能保持优越的性能,同时有效地保护了工人的位置隐私。; 关键词群智感知深度强化学习隐私保护双深度q网络能力阈值贪婪算法; Keywords crowd sensing deep reinforcement learning privacy protection double deep q-network capacity threshold greedy algorithm; 分类号 TP309 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于深度强化学习的增程式电动轻卡能量管理策略被引量：4: 5; 作者段龙锦王贵勇王伟超何述超; 机构昆明理工大学云南省内燃机重点实验室昆明云内动力股份有限公司; 出处《内燃机工程》 CAS CSCD 北大核心 2023年第6期90-99,共10页; 基金国家自然科学基金项目(52066008) 云南省科技厅揭榜制项目(202104BN050007) 云南省科技计划项目(202102AC080004)。; 文摘为了解决增程式电动轻卡辅助动力单元(auxiliary power units,APU)和动力电池之间能量的合理分配问题,在Simulink中建立面向控制的仿真模型,并提出一种基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法的实时能量管理策略,以发动机燃油消耗量、电池荷电状态(state of charge,SOC)变化等为优化目标,在世界轻型车辆测试程序(world light vehicle test procedure,WLTP)中对深度强化学习智能体进行训练。仿真结果表明,利用不同工况验证了基于TD3算法的能量管理策略(energy management strategy,EMS)具有较好的稳定性和适应性;TD3算法实现对发动机转速和转矩连续控制,使得输出功率更加平滑。将基于TD3算法的EMS与基于传统深度Q网络(deep Q-network,DQN)算法和深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法进行对比分析,结果表明:基于TD3算法的EMS燃油经济性分别相比基于DQN算法和DDPG算法提高了12.35%和0.67%,达到基于动态规划(dynamic programming,DP)算法的94.85%,收敛速度相比基于DQN算法和DDPG算法分别提高了40.00%和47.60%。; 关键词深度q网络深度确定性策略梯度双延迟深度确定性策略梯度算法增程式电动轻卡; Keywords deep q-network(DqN) deep deterministic policy gradient(DDPG) twin delayed deep deterministic policy gradient(TD3)algorithm extended range electric light truck; 分类号 TK421 [动力工程及工程热物理—动力机械及工程]; 在线阅读下载PDF 职称材料

题名考虑燃油消耗异质性的船舶进港效率与能耗协同优化: 6; 作者郭文强张新宇杨嵩旭; 机构大连海事大学; 出处《交通运输系统工程与信息》北大核心 2025年第4期297-305,共9页; 基金国家自然科学基金(52371359)。; 文摘针对不同类型船舶在进港过程中燃油消耗差异显著,调度效率与能耗优化难以兼顾的问题,本文研究考虑燃油消耗异质性的船舶进港效率与能耗协同优化方法,构建以最小化船舶总进港时间与总燃油消耗为目标的双目标混合整数非线性规划模型,提出一种深度Q网络(DQN)驱动的协同元启发式算法求解模型。算法设计中引入改进的Nawaz-Enscore-Ham启发式方法生成初始调度序列,并构建基于DQN的双种群协作搜索框架以动态调整船舶进港顺序与航速配置。以天津港典型调度实例为背景开展仿真对比实验,结果显示,深度Q网络驱动的协同元启发式算法在目标空间中解的质量与分布性能均优于传统启发式方法。与商业求解器CPLEX相比,该算法在求解效率上实现了指数级提升,其两个目标函数的综合偏差控制在2.04%~12.82%,能够稳定地获得接近最优的高质量近似解。进一步对比分析表明,在考虑燃油效率异质性的条件下,船舶的调度优先级发生明显变化,印证了能耗结构差异对进港组织策略的显著影响。; 关键词水路运输效率和油耗优化深度q网络进港船舶双种群协作框架; Keywords waterway transportation efficiency and fuel consumption optimization deep q-network port-arriving ships bi-population cooperative framework; 分类号 U692.3 [交通运输工程—港口、海岸及近海工程]; 在线阅读下载PDF 职称材料

题名基于深度强化学习的节能工艺路线发现方法被引量：2: 7; 作者陶鑫钰王艳纪志成; 机构江南大学轻工过程先进控制教育部重点实验室江南大学物联网工程学院; 出处《智能系统学报》 CSCD 北大核心 2023年第1期23-35,共13页; 基金国家重点研发计划项目(2018YFB1701903)。; 文摘由于传统基于固定加工环境的工艺路线制定规则,无法快速响应加工环境的动态变化制定节能工艺路线。因此提出了基于深度Q网络(deep Q network,DQN)的节能工艺路线发现方法。基于马尔可夫决策过程,定义状态向量、动作空间、奖励函数,建立节能工艺路线模型,并将加工环境动态变化的节能工艺路线规划问题,转化为DQN智能体决策问题,利用决策经验的可复用性和可扩展性,进行求解,同时为了提高DQN的收敛速度和解的质量,提出了基于S函数探索机制和加权经验池,并使用了双Q网络。仿真结果表明,相比较改进前,改进后的算法在动态加工环境中能够更快更好地发现节能工艺路线;与遗传算法、模拟退火算法以及粒子群算法相比,改进后的算法不仅能够以最快地速度发现节能工艺路线,而且能得到相同甚至更高精度的解。; 关键词深度强化学习深度q网络动态加工环境工艺路线马尔可夫决策过程智能体决策双q网络启发式算法; Keywords deep reinforcement learning deep q network dynamic machining environment process planning Markov decision process agent decision making double q network heuristic algorithm; 分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于双深度Q网络算法的无人机辅助密集网络资源优化策略	陈佳美孙慧雯李玉峰王宇鹏别玉霞	《电子与信息学报》北大核心	2025	0	在线阅读下载PDF 职称材料
2	基于双深度Q网络算法的多用户端对端能源共享机制研究	武东昊王国烽毛毳陈玉萍张有兵	《高技术通讯》 CAS 北大核心	2024	0	在线阅读下载PDF 职称材料
3	基于协作式深度强化学习的火灾应急疏散仿真研究	倪凌佳黄晓霞李红旮张子博	《系统仿真学报》 CAS CSCD 北大核心	2022	7	在线阅读下载PDF 职称材料
4	基于深度强化学习和隐私保护的群智感知动态任务分配策略	傅彦铭陆盛林陈嘉元覃华	《信息网络安全》 CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
5	基于深度强化学习的增程式电动轻卡能量管理策略	段龙锦王贵勇王伟超何述超	《内燃机工程》 CAS CSCD 北大核心	2023	4	在线阅读下载PDF 职称材料
6	考虑燃油消耗异质性的船舶进港效率与能耗协同优化	郭文强张新宇杨嵩旭	《交通运输系统工程与信息》北大核心	2025	0	在线阅读下载PDF 职称材料
7	基于深度强化学习的节能工艺路线发现方法	陶鑫钰王艳纪志成	《智能系统学报》 CSCD 北大核心	2023	2	在线阅读下载PDF 职称材料