-
题名融合先验知识与引导策略搜索的机器人轴孔装配方法
- 1
-
-
作者
陈豪杰
董青卫
刘锐楷
曾鹏
-
机构
中国科学院沈阳自动化研究所机器人学国家重点实验室
中国科学院网络化控制系统重点实验室
中国科学院机器人与智能制造创新研究院
中国科学院大学
-
出处
《计算机应用研究》
北大核心
2025年第4期1018-1024,共7页
-
基金
国家自然科学基金资助项目(92267301,92067205,92267205)
辽宁省自然科学基金资助项目(2024-MSBA-83)
+1 种基金
机器人学国家重点实验室(2023-Z15)
国家博士后基金资助项目(GZB20230805)。
-
文摘
在现代工业自动化领域,机器人执行复杂装配任务的能力至关重要。尽管强化学习为机器人策略学习提供了一种有效途径,但在装配任务的策略训练初始阶段存在采样效率低和样本质量差的问题,导致算法收敛速度慢,容易陷入局部最优解。针对上述问题,提出了一种融合先验知识与引导策略搜索算法的机器人轨迹规划方法。该方法首先利用人类专家演示和历史任务数据的先验知识来构建初始策略,并将先验知识保留在经验池中,以提高学习效率;随后,通过引导策略搜索算法对初始策略进行在线优化,逐步提升策略的精确度和适应性;最后,通过机器人轴孔装配任务进行实验验证,该方法显著提高了策略学习效率,减少了训练时间和试错次数。研究表明,融合先验知识的方法可以有效提高强化学习学习效率,使机器人快速得到能够完成装配任务的策略。
-
关键词
强化学习
先验知识
引导策略搜索
策略优化
轴孔装配任务
-
Keywords
reinforcement learning
prior knowledge
guided policy search
policy optimization
pin-hole assembly task
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-