期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
结合先验知识与深度强化学习的机械臂抓取研究 被引量:3
1
作者 缪刘洋 朱其新 +1 位作者 丁正凯 王旭 《西安工程大学学报》 CAS 2023年第4期92-101,共10页
在应用深度强化学习(deep reinforcement learning,DRL)实现机械臂自主行为决策过程中,高维连续的状态-动作空间易引起数据采样效率低及经验样本质量低,最终导致奖赏函数收敛速度慢、学习时间长。针对此问题,提出一种引入先验知识的DRL... 在应用深度强化学习(deep reinforcement learning,DRL)实现机械臂自主行为决策过程中,高维连续的状态-动作空间易引起数据采样效率低及经验样本质量低,最终导致奖赏函数收敛速度慢、学习时间长。针对此问题,提出一种引入先验知识的DRL模型。该模型与机械臂逆运动学相结合,在DRL采样阶段引入先验知识指导智能体(Agent)采样,解决学习过程中的数据采样效率低、经验样本质量低的问题;同时通过网络参数迁移的方式验证引入先验知识的DRL模型在面对新任务时仍具有较强的泛化能力;最后,利用Python和CoppeliaSim仿真平台进行联合仿真实验。结果表明:引入先验知识的DRL模型比原始模型的学习效率提升了13.89%、12.82%,完成任务的成功率提高了16.92%、13.25%;在新任务中,学习率提升了23.08%、23.33%,成功率提高了10.7%、11.57%。 展开更多
关键词 机械臂 先验知识 深度强化学习 网络迁移
在线阅读 下载PDF
改进D^(*)算法下的无人机三维路径规划 被引量:8
2
作者 汪小帅 朱其新 朱永红 《西安工程大学学报》 CAS 2023年第3期83-91,共9页
针对无人机使用传统D^(*)算法进行三维路径自主规划过程中,存在算法效率低和路径拐点多且复杂等问题,给出一种改进的D^(*)算法。首先,使用变步长的方式扩展节点,加快算法在规划阶段遍历节点的速度;同时,使用切比雪夫距离和曼哈顿距离的... 针对无人机使用传统D^(*)算法进行三维路径自主规划过程中,存在算法效率低和路径拐点多且复杂等问题,给出一种改进的D^(*)算法。首先,使用变步长的方式扩展节点,加快算法在规划阶段遍历节点的速度;同时,使用切比雪夫距离和曼哈顿距离的融合式作为代价值,改进代价函数,缩减算法计算量,克服算法效率低的问题;最后,将三维地图以及所得路径投影到二维平面上,选取关键节点,舍弃冗余节点,优化生成路径,所得路径的拐点数减少、复杂性降低。使用MATLAB进行仿真实验,仿真结果表明:改进后D^(*)算法可以有效利用于无人机在三维环境下的路径规划,在加快算法效率和提高路径质量方面取得了预期效果。 展开更多
关键词 三维 路径规划 D^(*)算法 无人机 仿真建模
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部