期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
多期贝叶斯强化学习鲁棒投资组合选择模型
1
作者 李柔佳 段启宏 +1 位作者 冯卓航 刘嘉 《工程数学学报》 CSCD 北大核心 2024年第2期232-244,共13页
在传统多期分布式鲁棒投资组合选择模型中,不确定集合的估计是一个具有挑战性的难题。使用贝叶斯强化学习方法来动态更新不确定集合中的一、二阶矩等模型参数,进而研究贝叶斯强化学习框架下均值–最坏鲁棒CVaR模型的求解问题。通过结合... 在传统多期分布式鲁棒投资组合选择模型中,不确定集合的估计是一个具有挑战性的难题。使用贝叶斯强化学习方法来动态更新不确定集合中的一、二阶矩等模型参数,进而研究贝叶斯强化学习框架下均值–最坏鲁棒CVaR模型的求解问题。通过结合动态规划和渐进对冲算法,设计了两层分解求解框架。下层通过求解一系列二阶锥规划来得到给定模型参数下子问题的最优策略,上层使用贝叶斯公式得到可实施的非预期投资策略。基于美国股票市场的实证结果表明:多期鲁棒强化学习投资组合选择模型相较传统模型具有更好的样本外投资表现。 展开更多
关键词 贝叶斯强化学习 鲁棒风险度量 投资组合 二阶锥规划
在线阅读 下载PDF
一种基于模型的可分解贝叶斯在线强化学习 被引量:2
2
作者 仵博 郑红燕 +1 位作者 冯延蓬 陈鑫 《电子学报》 EI CAS CSCD 北大核心 2014年第7期1429-1434,共6页
针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;然后,根据先验知识和观察数据采用贝叶斯方法来学习,最优化探... 针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;然后,根据先验知识和观察数据采用贝叶斯方法来学习,最优化探索和利用二者之间的平衡关系;最后,采用基于点的贝叶斯强化学习方法实现学习过程的快速收敛,从而达到在线学习的目的.仿真结果表明该算法能够满足实时系统性能的要求. 展开更多
关键词 马尔可夫决策过程 贝叶斯强化学习 动态贝叶斯网路
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部