期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的异构智能体编队避障控制方法
1
作者 虞逸凡 岳圣智 +2 位作者 徐俊 宋婧菡 林远山 《现代电子技术》 北大核心 2024年第15期102-108,共7页
针对在编队避障控制中智能体个体的异构性和多任务的复杂性问题,提出一种基于深度强化学习的异构智能体编队避障控制方法。首先,为了克服智能体个体的异构性,详细描述了领航者和跟随者智能体各自采用的局部观测表示;其次,根据智能体的... 针对在编队避障控制中智能体个体的异构性和多任务的复杂性问题,提出一种基于深度强化学习的异构智能体编队避障控制方法。首先,为了克服智能体个体的异构性,详细描述了领航者和跟随者智能体各自采用的局部观测表示;其次,根据智能体的相应任务,设计了编队、避障和导航三种复合的综合奖励函数,以实现更加灵活和高效的编队避障控制;最后,设计了融合注意力机制的行动者-评论家网络,用于联合训练领航者和跟随者的运动策略,从而使智能体能够逐步优化综合策略,以应对复杂的交互信息。数值仿真实验结果显示,文中提出的方法使得智能体能有效完成各自的任务,与其他强化学习算法相比,能够更迅速、更精确地使智能体学习到最优的运动策略,并在未来应用于复杂环境中,具有潜在的前景和价值。 展开更多
关键词 编队避障控制 异构性 多任务 领航者-跟随者 深度强化学习 综合奖励函数 注意力机制 运动策略
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部