期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
采用强化学习的多轴运动系统时间最优轨迹优化
被引量:
6
1
作者
张铁
廖才磊
+1 位作者
邹焱飚
康中强
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2021年第7期33-40,共8页
为实现多轴运动系统高速运动并解决电机动载荷过载的问题,提出了一种采用强化学习的时间最优轨迹优化方法。使用改进状态-动作-奖励-状态-动作(SARSA)算法和迭代交互法来寻找时间最优轨迹:通过改进SARSA算法与基于运动学模型建立的强化...
为实现多轴运动系统高速运动并解决电机动载荷过载的问题,提出了一种采用强化学习的时间最优轨迹优化方法。使用改进状态-动作-奖励-状态-动作(SARSA)算法和迭代交互法来寻找时间最优轨迹:通过改进SARSA算法与基于运动学模型建立的强化学习环境进行交互学习,找到满足运动学约束的初始策略轨迹;通过迭代交互法与真实环境进行交互学习,从而将电机动态载荷约束引入到强化学习环境中并对策略轨迹进行修正;最终得到满足电机动态载荷约束的时间最优轨迹。在自行搭建的两轴运动系统上进行验证,结果表明,改进SARSA算法优化得到的策略轨迹的速度和加速度曲线均在约束范围内,且经过10次迭代后的轨迹实际测量力矩曲线也在电机动载荷约束范围内,所提方法能够得到同时满足运动学约束和动力学约束的时间最优轨迹。
展开更多
关键词
多轴运动系统
电机动载荷过载
时间最优轨迹优化
强化学习
在线阅读
下载PDF
职称材料
题名
采用强化学习的多轴运动系统时间最优轨迹优化
被引量:
6
1
作者
张铁
廖才磊
邹焱飚
康中强
机构
华南理工大学机械与汽车工程学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2021年第7期33-40,共8页
基金
国家重点研发计划资助项目(2020YFC2007603)。
文摘
为实现多轴运动系统高速运动并解决电机动载荷过载的问题,提出了一种采用强化学习的时间最优轨迹优化方法。使用改进状态-动作-奖励-状态-动作(SARSA)算法和迭代交互法来寻找时间最优轨迹:通过改进SARSA算法与基于运动学模型建立的强化学习环境进行交互学习,找到满足运动学约束的初始策略轨迹;通过迭代交互法与真实环境进行交互学习,从而将电机动态载荷约束引入到强化学习环境中并对策略轨迹进行修正;最终得到满足电机动态载荷约束的时间最优轨迹。在自行搭建的两轴运动系统上进行验证,结果表明,改进SARSA算法优化得到的策略轨迹的速度和加速度曲线均在约束范围内,且经过10次迭代后的轨迹实际测量力矩曲线也在电机动载荷约束范围内,所提方法能够得到同时满足运动学约束和动力学约束的时间最优轨迹。
关键词
多轴运动系统
电机动载荷过载
时间最优轨迹优化
强化学习
Keywords
multi-axis motion system
motor dynamic overload
time-optimal trajectory optimization
reinforcement learning
分类号
TP273.1 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
采用强化学习的多轴运动系统时间最优轨迹优化
张铁
廖才磊
邹焱飚
康中强
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2021
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部