期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度循环双Q网络的无人机避障算法研究 被引量:6
1
作者 魏瑶 刘志成 +3 位作者 蔡彬 陈家新 杨尧 张凯 《西北工业大学学报》 EI CAS CSCD 北大核心 2022年第5期970-979,共10页
针对传统强化学习方法在机器运动规划领域,尤其是无人机避障问题上存在价值函数过度估计以及部分可观测性导致网络训练过程中训练时间长、难以收敛的问题,提出一种基于深度循环双Q网络的无人机避障算法。通过将单网络结构变换为双网络结... 针对传统强化学习方法在机器运动规划领域,尤其是无人机避障问题上存在价值函数过度估计以及部分可观测性导致网络训练过程中训练时间长、难以收敛的问题,提出一种基于深度循环双Q网络的无人机避障算法。通过将单网络结构变换为双网络结构,解耦最优动作选择和动作价值估计降低价值函数过度估计;在双网络模块的全连接层引入GRU循环神经网络模块,利用GRU处理时间维度信息,增强真实神经网络的可分析性,提高算法在部分可观察环境中的性能。在此基础上,结合强化学习优先经验回放机制加快网络收敛。在仿真环境中分别对原有算法以及改进算法进行测试,实验结果表明,该算法在训练时间、避障成功率以及鲁棒性方面均有更好的性能。 展开更多
关键词 深度强化学习 无人机 避障 循环神经网络 DDQN
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部