检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

多步积累奖励的双重时序Q网络算法被引量：2: 1; 作者朱威谯先锋 +1 位作者陈艺楷何德峰《控制理论与应用》 EI CAS CSCD 北大核心 2022年第2期222-230,共9页; 车辆行驶控制决策是无人驾驶的核心技术,现有基于深度强化学习的无人驾驶控制决策算法存在处理数据效率低、无法有效提取状态间时序特征等问题.因此本文提出了一种基于多步积累奖励的双重时序Q网络算法.首先,设计了一种多步积累奖励方法... 展开更多; 关键词深度强化学习无人车多步积累奖励时序网络数据利用率; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	多步积累奖励的双重时序Q网络算法	朱威谯先锋陈艺楷何德峰	《控制理论与应用》 EI CAS CSCD 北大核心	2022	2	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析