检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

多期贝叶斯强化学习鲁棒投资组合选择模型: 1; 作者李柔佳段启宏 +1 位作者冯卓航刘嘉《工程数学学报》 CSCD 北大核心 2024年第2期232-244,共13页; 在传统多期分布式鲁棒投资组合选择模型中,不确定集合的估计是一个具有挑战性的难题。使用贝叶斯强化学习方法来动态更新不确定集合中的一、二阶矩等模型参数,进而研究贝叶斯强化学习框架下均值–最坏鲁棒CVaR模型的求解问题。通过结合... 展开更多; 关键词贝叶斯强化学习鲁棒风险度量投资组合二阶锥规划; 在线阅读下载PDF 职称材料

一种基于模型的可分解贝叶斯在线强化学习被引量：2: 2; 作者仵博郑红燕 +1 位作者冯延蓬陈鑫《电子学报》 EI CAS CSCD 北大核心 2014年第7期1429-1434,共6页; 针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;然后,根据先验知识和观察数据采用贝叶斯方法来学习,最优化探... 展开更多; 关键词马尔可夫决策过程贝叶斯强化学习动态贝叶斯网路; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部