期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
离散线性系统部分可观测性测试配置 被引量:2
1
作者 杨拥民 黎湘 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第1期63-66,共4页
不可观测系统的部分状态可观测性对于大系统故障检测具有十分重要的意义。研究了基于部分可观测性的不可观测离散线性系统测点优化配置问题,证明了采用有限次观测值构造一个矩阵,可以给出部分可观测性成立的充分必要条件,并进一步证明... 不可观测系统的部分状态可观测性对于大系统故障检测具有十分重要的意义。研究了基于部分可观测性的不可观测离散线性系统测点优化配置问题,证明了采用有限次观测值构造一个矩阵,可以给出部分可观测性成立的充分必要条件,并进一步证明了部分可观测性的度量可以用一个矩阵的秩的特性来刻画。最后,给出了离散线性系统部分可观测性测试优化配置的度量指标。算例表明,提出的部分可观测性度量指标具有简单实用的特点。 展开更多
关键词 离散线系统 部分可观测性 奇异值 测试优化配置
在线阅读 下载PDF
基于隐式通信的值分解多智能体强化学习
2
作者 邓亚男 王秋红 +1 位作者 李俊杰 顾晶晶 《计算机科学与探索》 北大核心 2025年第7期1878-1887,共10页
在多智能体系统中,智能体通常只能观察到部分状态信息,导致每个智能体在作决策时缺乏对其他智能体行为和环境动态的完整理解,进而增加了协作的难度。虽然基于值函数分解的多智能体强化学习方法对解决局部可观测性问题有一定的优势,但由... 在多智能体系统中,智能体通常只能观察到部分状态信息,导致每个智能体在作决策时缺乏对其他智能体行为和环境动态的完整理解,进而增加了协作的难度。虽然基于值函数分解的多智能体强化学习方法对解决局部可观测性问题有一定的优势,但由于状态-动作空间维度高、模型结构复杂等问题,多智能体系统中仍然存在着协作不确定性的影响,从而导致奖励分配不公平的问题。提出了一种基于隐式通信的值分解多智能体强化学习方法(VFRL-IC),通过挖掘智能体之间的局部关系,缓解环境不确定性问题带来的影响:提出隐式通信框架,在训练阶段使智能体共享局部观测信息以训练局部策略;基于局部观测信息构建全局影响的评估模型,求解智能体间影响值;设计了一种类多头注意力机制的网络结构,融合智能体间影响值,求解包含全局信息的局部动作值模型。在星际争霸环境中进行实验验证,结果表明,VFRL-IC在各场景中的平均成功率优于基线算法15~40个百分点,效率提高18%。 展开更多
关键词 值分解 多智能体强化学习 部分可观测性 不确定 隐式通信
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部