期刊文献+

基于课程式双重DQN的水下无人航行器路径规划 被引量:2

Path Planning of Underwater Unmanned Vehicle Based on Curriculum Double Deep Q Network
在线阅读 下载PDF
导出
摘要 针对水下无人航行器路径规划中强化学习方法存在训练不稳定、时间长的弊端,提出了一种课程式双重深度Q学习网络(DQN)算法。该算法融合经验回放池技术,有效缩短了训练时间,并消除了Q学习网络引起的最大化偏差问题。同时,结合课程式学习改进双重DQN算法,加快了学习收敛速度。通过静态、动态障碍物环境的水下无人航行器路径规划仿真结果表明,所提出的课程式双重DQN算法可行、有效。该实验仿真研究可培养学生开展独立科学研究的能力。 For unmanned underwater vehicle(UUV), there are disadvantages such as unstable training and long training time using reinforcement learning, a curriculum double deep Q network(Double DQN) algorithm is proposed for UUV’s path planning. It incorporates experience playback pool technology to effectively shorten the training time, and eliminates the maximum deviation caused by Q learning. Meanwhile, the curriculum-based learning is designed to improve convergence rate for the double DQN algorithm. By UUV’s global path planning simulations under static and dynamic environments, the effectiveness of the curriculum Double DQN algorithm is verified. This simulation experiment has effectively cultivated students’ independent research ability.
作者 王莹莹 周佳加 高峰 管凤旭 WANG Yingying;ZHOU Jiajia;GAO Feng;GUAN Fengxu(College of Intelligent Systems Science and Engineering,Harbin Engineering University,Harbin 150001,China)
出处 《实验室研究与探索》 CAS 北大核心 2022年第3期244-248,共5页 Research and Exploration In Laboratory
基金 国家自然科学基金项目(51609048,62071138) 哈尔滨工程大学本科教学改革研究项目(JG2019B11)。
关键词 水下无人航行器 路径规划 双重深度Q网络 课程式学习 unmanned underwater vehicle(UUV) path planning double deep Q network curriculum learning
作者简介 王莹莹(1982-),女,黑龙江哈尔滨人,硕士,工程师,主要从事自动化技术与工程教学方面研究。Tel.:0451-82569722,E-mail:w_winny@hrbeu.edu.cn;通信作者:周佳加(1982-),男,浙江杭州人,博士,副教授,主要从事水下机器人智能控制技术等方面研究。Tel.:0451-82569722,E-mail:zhoujiajia@hrbeu.edu.cn。
  • 相关文献

参考文献2

二级参考文献20

  • 1张汝波,吴俊伟,刘冠群,刘海涛.自主式水下机器人分层规划与重规划[J].华中科技大学学报(自然科学版),2013,41(S1):77-80. 被引量:1
  • 2燕奎臣,吴利红.AUV水下对接关键技术研究[J].机器人,2007,29(3):267-273. 被引量:59
  • 3Chander A,Chatterjee A,Siarry P.A new social and mo- mentum component adaptive PSO algorithm for image seg- mentation[J].Expert Systems with Applications, 2011,38: 4998-5004.
  • 4Gupta S,Devi S.Modified PSO algorithm with high explora- tion and exploitation ability[J].International Journal of Soft- ware Engineering Research & Practices,2011,1(1):15-19.
  • 5Ratnaweera A,Halgamuge S K,Watson H hierarchical Particle Swarm Optimizer with celeration coefficients[J].IEEE Transactions Computation, 2004,8 ( 3 ) : 240-255. C. Self-organizing time-varying ac- on Evolutionary.
  • 6Parsopoulos K E, Plagianakos V P, Magoulas G D, et al.Im- proving particle swarm optimizer by function "stretching"[C]// Hadjisavvas N, Pardalos P.Advances in Convex Analysis and Global Optimization.The Netherlands: Kluwer Academic Pub- lishers, 2001 : 445-457.
  • 7Shi Y,Eberhart R.A modified particle swarm optimizer[C]// IEEE World Conf on Computational Intelligence.Piscataway: IEEE Press, 1998:69-73.
  • 8Chen D ,Wang G F, Chen Z Y.The inertia weight self-adapt- ing in PSO[C]//Proc of the 7th World Congress on Intelli- gent Control and Automation, Chongqing, 2008 : 5313-5316.
  • 9张顶学,关治洪,刘新芝.一种动态改变惯性权重的自适应粒子群算法[J].控制与决策,2008,23(11):1253-1257. 被引量:97
  • 10都延丽,吴庆宪,姜长生,周丽.改进协同微粒群优化的模糊神经网络控制系统设计[J].控制与决策,2008,23(12):1327-1332. 被引量:5

共引文献11

同被引文献26

引证文献2

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部