检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于值学习与策略梯度的深度强化学习在核工程领域的适配性分析: 1; 作者谭思超刘震 +5 位作者刘永超李桐梁彪王博李江宽田瑞峰《原子能科学技术》 EI CAS CSCD 北大核心 2024年第S02期382-392,共11页; 深度强化学习能够实现端到端处理,将高维度的原始输入数据直接转化为输出动作。深度强化学习按照间接和直接的策略优化方式,主要可分为基于值学习和基于策略梯度的两类方法。二者因原理不同,在解决问题的能力和适用场景上存在差异。核... 展开更多; 关键词人工智能深度强化学习值函数策略梯度; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于值学习与策略梯度的深度强化学习在核工程领域的适配性分析	谭思超刘震刘永超李桐梁彪王博李江宽田瑞峰	《原子能科学技术》 EI CAS CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析