检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于Dyna框架的非参数化近似策略迭代增强学习: 1; 作者季挺张华《计算机应用》 CSCD 北大核心 2018年第5期1230-1238,共9页; 为解决当前近似策略迭代增强学习算法逼近器不能完全自动构建的问题,提出一种基于Dyna框架的非参数化近似策略迭代(NPAPI-Dyna)增强学习算法。引入采样缓存和采样变化率设计二级随机采样过程采集样本,基于轮廓指标、采用K均值聚类算法实... 展开更多; 关键词增强学习 Dyna框架策略迭代非参数化近似策略倒立摆; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于Dyna框架的非参数化近似策略迭代增强学习	季挺张华	《计算机应用》 CSCD 北大核心	2018	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析