期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于归一化优势函数的强化学习混合动力履带车辆能量管理
被引量:
4
1
作者
邹渊
张彬
+4 位作者
张旭东
赵志颖
康铁宇
郭玉枫
吴喆
《兵工学报》
EI
CAS
CSCD
北大核心
2021年第10期2159-2169,共11页
基于强化学习的能量管理策略由于状态变量和控制变量的离散化,处理高维问题时存在“维数灾难”的困扰。针对此问题,提出一种基于归一化优势函数的深度强化学习能量管理算法。采用两个具有归一化优势函数的深度神经网络实现连续控制,消...
基于强化学习的能量管理策略由于状态变量和控制变量的离散化,处理高维问题时存在“维数灾难”的困扰。针对此问题,提出一种基于归一化优势函数的深度强化学习能量管理算法。采用两个具有归一化优势函数的深度神经网络实现连续控制,消除离散化。在对串联式混合动力履带车辆动力总成建模的基础上,完成深度强化学习能量管理算法的框架搭建和参数的更新过程,并将其应用于串联式混合动力履带车辆。仿真结果表明,该算法能够输出更为细化的控制量以及更小的输出波动性,与深度Q学习算法相比,对于串联式混合动力履带车辆的燃油经济性提升了3.96%.通过硬件在环仿真实验验证了强化学习能量管理算法的适应性,以及在实时控制环境下的优化效果。
展开更多
关键词
履带车辆
能量管理策略
归一化优势函数
连续控制
串联式混合动力
硬件在环仿真
在线阅读
下载PDF
职称材料
题名
基于归一化优势函数的强化学习混合动力履带车辆能量管理
被引量:
4
1
作者
邹渊
张彬
张旭东
赵志颖
康铁宇
郭玉枫
吴喆
机构
北京理工大学机械与车辆学院
北京北方车辆集团有限公司
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2021年第10期2159-2169,共11页
基金
国家自然科学基金项目(51775039)。
文摘
基于强化学习的能量管理策略由于状态变量和控制变量的离散化,处理高维问题时存在“维数灾难”的困扰。针对此问题,提出一种基于归一化优势函数的深度强化学习能量管理算法。采用两个具有归一化优势函数的深度神经网络实现连续控制,消除离散化。在对串联式混合动力履带车辆动力总成建模的基础上,完成深度强化学习能量管理算法的框架搭建和参数的更新过程,并将其应用于串联式混合动力履带车辆。仿真结果表明,该算法能够输出更为细化的控制量以及更小的输出波动性,与深度Q学习算法相比,对于串联式混合动力履带车辆的燃油经济性提升了3.96%.通过硬件在环仿真实验验证了强化学习能量管理算法的适应性,以及在实时控制环境下的优化效果。
关键词
履带车辆
能量管理策略
归一化优势函数
连续控制
串联式混合动力
硬件在环仿真
Keywords
series hybrid tracked vehicle
energy management strategy
normalized advantage function
continuous control
hardware-in-the-loop simulation
分类号
TJ810.2 [兵器科学与技术—武器系统与运用工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于归一化优势函数的强化学习混合动力履带车辆能量管理
邹渊
张彬
张旭东
赵志颖
康铁宇
郭玉枫
吴喆
《兵工学报》
EI
CAS
CSCD
北大核心
2021
4
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部