-
题名多期贝叶斯强化学习鲁棒投资组合选择模型
- 1
-
-
作者
李柔佳
段启宏
冯卓航
刘嘉
-
机构
西安交通大学数学与统计学院
-
出处
《工程数学学报》
CSCD
北大核心
2024年第2期232-244,共13页
-
基金
国家重点研发计划(2022YFA1004000)
国家自然科学基金(11991023,12371324).
-
文摘
在传统多期分布式鲁棒投资组合选择模型中,不确定集合的估计是一个具有挑战性的难题。使用贝叶斯强化学习方法来动态更新不确定集合中的一、二阶矩等模型参数,进而研究贝叶斯强化学习框架下均值–最坏鲁棒CVaR模型的求解问题。通过结合动态规划和渐进对冲算法,设计了两层分解求解框架。下层通过求解一系列二阶锥规划来得到给定模型参数下子问题的最优策略,上层使用贝叶斯公式得到可实施的非预期投资策略。基于美国股票市场的实证结果表明:多期鲁棒强化学习投资组合选择模型相较传统模型具有更好的样本外投资表现。
-
关键词
贝叶斯强化学习
鲁棒风险度量
投资组合
二阶锥规划
-
Keywords
Bayesian reinforcement learning
robust risk measure
portfolio selection
secondorder cone programming
-
分类号
O221.5
[理学—运筹学与控制论]
F224.3
[经济管理—国民经济]
-
-
题名一种基于模型的可分解贝叶斯在线强化学习
被引量:2
- 2
-
-
作者
仵博
郑红燕
冯延蓬
陈鑫
-
机构
深圳职业技术学院教育技术与信息中心
中南大学信息科学与工程学院
先进控制与智能自动化湖南省工程实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2014年第7期1429-1434,共6页
-
基金
国家自然科学基金(No.61074058
No.60874042)
深圳市自然科学基金(No.JCYJ20120617134831736)
-
文摘
针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;然后,根据先验知识和观察数据采用贝叶斯方法来学习,最优化探索和利用二者之间的平衡关系;最后,采用基于点的贝叶斯强化学习方法实现学习过程的快速收敛,从而达到在线学习的目的.仿真结果表明该算法能够满足实时系统性能的要求.
-
关键词
马尔可夫决策过程
贝叶斯强化学习
动态贝叶斯网路
-
Keywords
Markov decision processes
Bayesian reinforcement learning
dynamic Bayesian networks
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-