检索结果-维普期刊中文期刊服务平台

DQN-based decentralized multi-agent JSAP resource allocation for UAV swarm communication 被引量：5: 1; 作者 LI Jie DANG Xiaoyu LI Sai 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第2期289-298,共10页; It is essential to maximize capacity while satisfying the transmission time delay of unmanned aerial vehicle(UAV)swarm communication system.In order to address this challenge,a dynamic decentralized optimization mecha... 展开更多; 关键词 joint spectrum and power(JSAP) unmanned aerial vehicle(UAV)swarm communication deep q-learning network(dqn) UAV to UAV(U2U); 在线阅读下载PDF 职称材料

考虑行为克隆的深度强化学习股票交易策略被引量：3: 2; 作者杨兴雨陈亮威 +1 位作者郑萧腾张永《系统管理学报》 CSSCI CSCD 北大核心 2024年第1期150-161,共12页; 为提高股票投资的收益并降低风险,将模仿学习中的行为克隆思想引入深度强化学习框架中设计股票交易策略。在策略设计过程中,将对决DQN深度强化学习算法和行为克隆进行结合,使智能体在自主探索的同时模仿事先构造的投资专家的决策。选择... 展开更多; 关键词股票交易策略深度强化学习模仿学习行为克隆对决深度Q学习网络; 在线阅读下载PDF 职称材料

基于强化学习的改进NSGA-Ⅱ算法的城市快速路入口匝道控制: 3; 作者陈娟郭琦《上海大学学报（自然科学版）》 CAS CSCD 北大核心 2023年第4期666-680,共15页; 为了缓解城市快速路拥堵和尾气排放问题,提出了基于竞争结构和深度循环Q网络的改进非支配排序遗传算法(non-dominated sorting genetic algorithm Ⅱ based on dueling deep recurrent Q network, DRQN-NSGA-Ⅱ).该算法结合了基于竞争... 展开更多; 关键词匝道控制基于竞争结构的深度Q网络深度循环Q网络非支配排序遗传算法; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	DQN-based decentralized multi-agent JSAP resource allocation for UAV swarm communication	LI Jie DANG Xiaoyu LI Sai	《Journal of Systems Engineering and Electronics》 SCIE EI CSCD	2023	5	在线阅读下载PDF 职称材料
2	考虑行为克隆的深度强化学习股票交易策略	杨兴雨陈亮威郑萧腾张永	《系统管理学报》 CSSCI CSCD 北大核心	2024	3	在线阅读下载PDF 职称材料
3	基于强化学习的改进NSGA-Ⅱ算法的城市快速路入口匝道控制	陈娟郭琦	《上海大学学报（自然科学版）》 CAS CSCD 北大核心	2023	0	在线阅读下载PDF 职称材料