检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于强化学习的合作线性二次微分博弈研究: 1; 作者赵子豪彭称称张维海《山东科技大学学报(自然科学版)》北大核心 2025年第4期121-130,共10页; 本研究利用强化学习研究了系统部分未知的无限时域合作线性二次微分博弈的Pareto最优性问题。首先,在仅知道部分系统动力学矩阵参数的前提下,通过收集每个玩家的状态信息来推导策略迭代算法,得到相应代数黎卡提方程的近似解;然后,通过... 展开更多; 关键词策略迭代 PARETO最优合作微分博弈线性二次理论强化学习; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于强化学习的合作线性二次微分博弈研究	赵子豪彭称称张维海	《山东科技大学学报(自然科学版)》北大核心	2025	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析