检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于二阶价值梯度模型强化学习的工业过程控制方法被引量：1: 1; 作者张博潘福成 +1 位作者周晓锋李帅《计算机应用研究》 CSCD 北大核心 2024年第8期2434-2440,共7页; 为了实现对高延时、非线性和强耦合的复杂工业过程稳定准确的连续控制,提出了一种基于二阶价值梯度模型强化学习的控制方法。首先,该方法在模型训练过程中加入了状态价值函数的二阶梯度信息,具备更精确的函数逼近能力和更高的鲁棒性,学... 展开更多; 关键词工业过程控制模型强化学习二阶价值梯度状态价值函数状态采样策略; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于二阶价值梯度模型强化学习的工业过程控制方法	张博潘福成周晓锋李帅	《计算机应用研究》 CSCD 北大核心	2024	1	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析