-
题名结合先验知识与深度强化学习的机械臂抓取研究
被引量:3
- 1
-
-
作者
缪刘洋
朱其新
丁正凯
王旭
-
机构
苏州科技大学电子与信息工程学院
苏州科技大学机械工程学院/建筑智慧节能江苏省重点实验室/苏州市共融机器人技术重点实验室
苏州科技大学电子与信息工程学院/建筑智慧节能江苏省重点实验室
-
出处
《西安工程大学学报》
CAS
2023年第4期92-101,共10页
-
基金
国家自然科学基金(51875380,62063010)
泰州市科技计划项目(TG202117)。
-
文摘
在应用深度强化学习(deep reinforcement learning,DRL)实现机械臂自主行为决策过程中,高维连续的状态-动作空间易引起数据采样效率低及经验样本质量低,最终导致奖赏函数收敛速度慢、学习时间长。针对此问题,提出一种引入先验知识的DRL模型。该模型与机械臂逆运动学相结合,在DRL采样阶段引入先验知识指导智能体(Agent)采样,解决学习过程中的数据采样效率低、经验样本质量低的问题;同时通过网络参数迁移的方式验证引入先验知识的DRL模型在面对新任务时仍具有较强的泛化能力;最后,利用Python和CoppeliaSim仿真平台进行联合仿真实验。结果表明:引入先验知识的DRL模型比原始模型的学习效率提升了13.89%、12.82%,完成任务的成功率提高了16.92%、13.25%;在新任务中,学习率提升了23.08%、23.33%,成功率提高了10.7%、11.57%。
-
关键词
机械臂
先验知识
深度强化学习
网络迁移
-
Keywords
robotic arms
prior knowledge
deep reinforcement learning
network migration
-
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名改进D^(*)算法下的无人机三维路径规划
被引量:8
- 2
-
-
作者
汪小帅
朱其新
朱永红
-
机构
苏州科技大学电子与信息工程学院
苏州科技大学机械工程学院/建筑智慧节能江苏省重点实验室/苏州市共融机器人技术重点实验室
景德镇陶瓷大学机电工程学院
-
出处
《西安工程大学学报》
CAS
2023年第3期83-91,共9页
-
基金
国家自然科学基金面上项目(51875380,62063010)
泰州市科技计划资助项目(TG202117)。
-
文摘
针对无人机使用传统D^(*)算法进行三维路径自主规划过程中,存在算法效率低和路径拐点多且复杂等问题,给出一种改进的D^(*)算法。首先,使用变步长的方式扩展节点,加快算法在规划阶段遍历节点的速度;同时,使用切比雪夫距离和曼哈顿距离的融合式作为代价值,改进代价函数,缩减算法计算量,克服算法效率低的问题;最后,将三维地图以及所得路径投影到二维平面上,选取关键节点,舍弃冗余节点,优化生成路径,所得路径的拐点数减少、复杂性降低。使用MATLAB进行仿真实验,仿真结果表明:改进后D^(*)算法可以有效利用于无人机在三维环境下的路径规划,在加快算法效率和提高路径质量方面取得了预期效果。
-
关键词
三维
路径规划
D^(*)算法
无人机
仿真建模
-
Keywords
three dimension
path planning
D^(*)algorithm
unmanned aerial vehicle
simulation modeling
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-