期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
无人机辅助的双层深度强化学习任务卸载算法
被引量:
2
1
作者
陈钊
龚本灿
《计算机应用研究》
CSCD
北大核心
2024年第2期426-431,共6页
为了解决无人机轨迹优化、用户功率分配和任务卸载策略问题,提出了一种双层深度强化学习任务卸载算法。上层采用多智能体深度强化学习来优化无人机的轨迹,并动态分配用户的传输功率以提高网络传输速率;下层采用多个并行的深度神经网络...
为了解决无人机轨迹优化、用户功率分配和任务卸载策略问题,提出了一种双层深度强化学习任务卸载算法。上层采用多智能体深度强化学习来优化无人机的轨迹,并动态分配用户的传输功率以提高网络传输速率;下层采用多个并行的深度神经网络来求解最优卸载决策以最小化网络的时延和能耗。仿真结果表明,该算法使得无人机能够跟踪用户的移动,显著降低系统的时延和能耗,能够给用户提供更优质的任务卸载服务。
展开更多
关键词
无人机辅助
轨迹优化
双层深度强化学习
任务卸载
在线阅读
下载PDF
职称材料
集成深度强化学习在股票指数投资组合优化中的应用分析
被引量:
1
2
作者
冀中
张文嘉
《计算机科学与探索》
北大核心
2025年第1期237-244,共8页
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法...
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法对三种代理(优势演员-评论员、深度确定性策略梯度和近端策略优化)进行两层嵌套模式,第一层集成通过最优化夏普比率进行阶段模型选择,第二层通过加权投票的方法集成三种深度强化学习算法,从单次训练中收集多个模型快照,在训练期间利用这些模型进行集成预测。分别对上证50投资指数和道琼斯指数及其包含的股票进行了投资组合研究,将持有指数被动策略和均值方差投资组合策略作为基线策略。实验采用了投资组合价值、年化回报率、年化波动率、最大回撤和夏普比率等指标作为对比指标。结果表明,所提出的集成方法在实用性和有效性上表现出较好的性能。
展开更多
关键词
股票投资组合
交易策略
深度
强化
学习
双层
嵌套集成
深度
强化
学习
方法
集成
学习
在线阅读
下载PDF
职称材料
题名
无人机辅助的双层深度强化学习任务卸载算法
被引量:
2
1
作者
陈钊
龚本灿
机构
三峡大学计算机与信息学院
三峡大学水电工程智能视觉监测湖北省重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2024年第2期426-431,共6页
基金
国家自然科学基金资助项目(62172255)。
文摘
为了解决无人机轨迹优化、用户功率分配和任务卸载策略问题,提出了一种双层深度强化学习任务卸载算法。上层采用多智能体深度强化学习来优化无人机的轨迹,并动态分配用户的传输功率以提高网络传输速率;下层采用多个并行的深度神经网络来求解最优卸载决策以最小化网络的时延和能耗。仿真结果表明,该算法使得无人机能够跟踪用户的移动,显著降低系统的时延和能耗,能够给用户提供更优质的任务卸载服务。
关键词
无人机辅助
轨迹优化
双层深度强化学习
任务卸载
Keywords
UAV-assisted
trajectory optimization
two-layer deep reinforcement learning
task offloading
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
集成深度强化学习在股票指数投资组合优化中的应用分析
被引量:
1
2
作者
冀中
张文嘉
机构
天津大学电气自动化与信息工程学院
天津大学佐治亚理工深圳学院
出处
《计算机科学与探索》
北大核心
2025年第1期237-244,共8页
文摘
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法对三种代理(优势演员-评论员、深度确定性策略梯度和近端策略优化)进行两层嵌套模式,第一层集成通过最优化夏普比率进行阶段模型选择,第二层通过加权投票的方法集成三种深度强化学习算法,从单次训练中收集多个模型快照,在训练期间利用这些模型进行集成预测。分别对上证50投资指数和道琼斯指数及其包含的股票进行了投资组合研究,将持有指数被动策略和均值方差投资组合策略作为基线策略。实验采用了投资组合价值、年化回报率、年化波动率、最大回撤和夏普比率等指标作为对比指标。结果表明,所提出的集成方法在实用性和有效性上表现出较好的性能。
关键词
股票投资组合
交易策略
深度
强化
学习
双层
嵌套集成
深度
强化
学习
方法
集成
学习
Keywords
stock portfolio
trading strategy
deep reinforcement learning
two-layer nested ensemble deep reinforcement learning methods
ensemble learning
分类号
TP3-05 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
无人机辅助的双层深度强化学习任务卸载算法
陈钊
龚本灿
《计算机应用研究》
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
2
集成深度强化学习在股票指数投资组合优化中的应用分析
冀中
张文嘉
《计算机科学与探索》
北大核心
2025
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部