检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

面向参数化动作空间的多智能体中心化策略梯度分解及其应用被引量：2: 1; 作者田树聪谢愈 +2 位作者张远龙周正春高阳《软件学报》北大核心 2025年第2期590-607,共18页; 近年来,多智能体强化学习方法凭借AlphaStar、AlphaDogFight、AlphaMosaic等成功案例展示出卓越的决策能力以及广泛的应用前景.在真实环境的多智能体决策系统中,其任务的决策空间往往是同时具有离散型动作变量和连续型动作变量的参数化... 展开更多; 关键词参数化动作空间多智能体强化学习中心化策略梯度分解多巡航导弹突防; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	面向参数化动作空间的多智能体中心化策略梯度分解及其应用	田树聪谢愈张远龙周正春高阳	《软件学报》北大核心	2025	2	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析