检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于动作空间划分的MAXQ自动分层方法: 1; 作者王奇秦进《计算机应用》 CSCD 北大核心 2017年第5期1357-1362,共6页; 针对分层强化学习需要人工给出层次结构这一问题,同时考虑到基于状态空间的自动分层方法在环境状态中没有明显子目标时分层效果并不理想的情况,提出一种基于动作空间的自动构造层次结构方法。首先,根据动作影响的状态分量将动作集合划... 展开更多; 关键词强化学习分层强化学习自动分层方法马尔可夫决策过程子任务; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于动作空间划分的MAXQ自动分层方法	王奇秦进	《计算机应用》 CSCD 北大核心	2017	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析