检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

改进双延迟深度确定性策略梯度的多船协调避碰决策: 1; 作者黄仁贤罗亮 +1 位作者杨萌刘维勤《计算机科学》 CSCD 北大核心 2023年第11期269-281,共13页; 目前,多数海上避碰模型都是将船舶作为单智能体进行避碰决策,未考虑船舶间的协调避让,在多船会遇场景下仅靠单船进行避碰操作会导致避让效果不佳。为此,提出了一种改进双延迟深度确定性策略梯度算法(TD3)的Softmax深层双确定性策略梯度(... 展开更多; 关键词多船会遇协调避碰智能决策双延迟深度确定性策略梯度(TD3) softmax深层双确定性策略梯度(sd3) 强化学习; 在线阅读下载PDF 职称材料

基于多智能体深度强化学习的多船协同避碰策略: 2; 作者黄仁贤罗亮《计算机集成制造系统》 EI CSCD 北大核心 2024年第6期1972-1988,共17页; 为了提高多船会遇时智能避碰策略的协同性、安全性、实用性和节能性,在中心化训练去中心化执行框架下,结合优先经验回放机制提出一种多智能体Softmax深层双确定性策略梯度PER-MASD3算法,用于解决多船协同避碰问题,该算法不仅解决了双延... 展开更多; 关键词多智能体深度强化学习协同避碰中心化训练去中心化执行优先经验回放多智能体softmax深层双确定性策略梯度; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部