期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进TD3算法的无人机决策研究 被引量:1
1
作者 蒋方庆 陈自力 +2 位作者 高喜俊 王春峰 贺道坤 《信息化研究》 2023年第3期36-42,共7页
针对无人机在执行打击任务时,对飞行区域的环境掌握甚少、飞行区域大、目标稀疏、火力威胁等相对不确定因素会导致任务的完成度低的问题。本文提出利用双策略网络对双延迟深度确定性策略梯度算法(TD3)进行改进,解决单策略动作波动大问... 针对无人机在执行打击任务时,对飞行区域的环境掌握甚少、飞行区域大、目标稀疏、火力威胁等相对不确定因素会导致任务的完成度低的问题。本文提出利用双策略网络对双延迟深度确定性策略梯度算法(TD3)进行改进,解决单策略动作波动大问题。针对优质训练样本利用率低导致的收敛速度慢问题,采用优先经验回放机制提高优质样本利用率。使用改进后的TD3算法训练无人机,通过改变偏航角、俯仰角以及速度控制无人机飞行,无人机在三维环境中完成抵近打击任务并规避威胁。实验结果表明,改进后的算法相比于传统TD3算法,算法收敛的速度更快,无人机的任务完成度可相对提高15%。 展开更多
关键词 无人机 延迟深度确定性策略梯度算法 双策略网络 优先经验回放
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部