期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制
被引量:
3
1
作者
任坚
刘剑慰
杨蒲
《控制理论与应用》
EI
CAS
CSCD
北大核心
2020年第7期1429-1438,共10页
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错...
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了该方法的有效性.
展开更多
关键词
飞行控制系统
故障诊断
故障容错
强化学习
Q-learning算法
增量式策略
状态转移预测网络
在线阅读
下载PDF
职称材料
题名
基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制
被引量:
3
1
作者
任坚
刘剑慰
杨蒲
机构
南京航空航天大学自动化学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2020年第7期1429-1438,共10页
基金
民航飞机健康监测与智能维护重点实验室基金项目(NJ2018012)
先进飞行器导航、控制与健康管理工业和信息化部重点实验室(南京航空航天大学)项目
+1 种基金
中央高校基本科研业务费项目(NS2017017)
国家自然科学基金项目(61533008,61490703)资助。
文摘
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了该方法的有效性.
关键词
飞行控制系统
故障诊断
故障容错
强化学习
Q-learning算法
增量式策略
状态转移预测网络
Keywords
flight control systems
fault diagnosis
fault tolerance
reinforcement learning
Q-learning algorithm
incremental strategy
state transition prediction
分类号
V249 [航空宇航科学与技术—飞行器设计]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制
任坚
刘剑慰
杨蒲
《控制理论与应用》
EI
CAS
CSCD
北大核心
2020
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部