期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
集成深度强化学习在股票指数投资组合优化中的应用分析
被引量:
1
1
作者
冀中
张文嘉
《计算机科学与探索》
北大核心
2025年第1期237-244,共8页
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法...
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法对三种代理(优势演员-评论员、深度确定性策略梯度和近端策略优化)进行两层嵌套模式,第一层集成通过最优化夏普比率进行阶段模型选择,第二层通过加权投票的方法集成三种深度强化学习算法,从单次训练中收集多个模型快照,在训练期间利用这些模型进行集成预测。分别对上证50投资指数和道琼斯指数及其包含的股票进行了投资组合研究,将持有指数被动策略和均值方差投资组合策略作为基线策略。实验采用了投资组合价值、年化回报率、年化波动率、最大回撤和夏普比率等指标作为对比指标。结果表明,所提出的集成方法在实用性和有效性上表现出较好的性能。
展开更多
关键词
股票投资组合
交易策略
深度强化学习
双层嵌套集成深度强化学习方法
集成学习
在线阅读
下载PDF
职称材料
基于集成深度强化学习的自动驾驶车辆行为决策模型
被引量:
5
2
作者
张新锋
吴琳
《汽车安全与节能学报》
CAS
CSCD
北大核心
2023年第4期472-479,共8页
提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道...
提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道、4车道、5车道数量场景下,对向左换道、车道保持、向右换道、同车道加速和减速等5种车辆驾驶行为,进行测试和泛化性验证。结果表明:与其它3种网络模型相比,该模型的决策成功率分别提高了6%、3%和6%;平均车速也有提升;100回合的测试,耗时小于1 ms,满足决策实时性要求。因而,该决策模型提高了行车安全和决策效率。
展开更多
关键词
自动驾驶
深度强化学习
集成学习
深度Q网络(DQN)
标准投票法
在线阅读
下载PDF
职称材料
题名
集成深度强化学习在股票指数投资组合优化中的应用分析
被引量:
1
1
作者
冀中
张文嘉
机构
天津大学电气自动化与信息工程学院
天津大学佐治亚理工深圳学院
出处
《计算机科学与探索》
北大核心
2025年第1期237-244,共8页
文摘
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法对三种代理(优势演员-评论员、深度确定性策略梯度和近端策略优化)进行两层嵌套模式,第一层集成通过最优化夏普比率进行阶段模型选择,第二层通过加权投票的方法集成三种深度强化学习算法,从单次训练中收集多个模型快照,在训练期间利用这些模型进行集成预测。分别对上证50投资指数和道琼斯指数及其包含的股票进行了投资组合研究,将持有指数被动策略和均值方差投资组合策略作为基线策略。实验采用了投资组合价值、年化回报率、年化波动率、最大回撤和夏普比率等指标作为对比指标。结果表明,所提出的集成方法在实用性和有效性上表现出较好的性能。
关键词
股票投资组合
交易策略
深度强化学习
双层嵌套集成深度强化学习方法
集成学习
Keywords
stock portfolio
trading strategy
deep
reinforcement
learning
two-layer nested ensemble deep reinforcement learning methods
ensemble
learning
分类号
TP3-05 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
基于集成深度强化学习的自动驾驶车辆行为决策模型
被引量:
5
2
作者
张新锋
吴琳
机构
长安大学汽车学院
出处
《汽车安全与节能学报》
CAS
CSCD
北大核心
2023年第4期472-479,共8页
基金
陕西省重点研发计划项目(2022GY-303)
西安市科技计划项目(2022GXFW0152)。
文摘
提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道、4车道、5车道数量场景下,对向左换道、车道保持、向右换道、同车道加速和减速等5种车辆驾驶行为,进行测试和泛化性验证。结果表明:与其它3种网络模型相比,该模型的决策成功率分别提高了6%、3%和6%;平均车速也有提升;100回合的测试,耗时小于1 ms,满足决策实时性要求。因而,该决策模型提高了行车安全和决策效率。
关键词
自动驾驶
深度强化学习
集成学习
深度Q网络(DQN)
标准投票法
Keywords
autonomous driving
deep
reinforcement
learning
ensemble
learning
deep
Q-network(DQN)
standard voting
method
分类号
U461 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
集成深度强化学习在股票指数投资组合优化中的应用分析
冀中
张文嘉
《计算机科学与探索》
北大核心
2025
1
在线阅读
下载PDF
职称材料
2
基于集成深度强化学习的自动驾驶车辆行为决策模型
张新锋
吴琳
《汽车安全与节能学报》
CAS
CSCD
北大核心
2023
5
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部