期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
离散线性系统部分可观测性测试配置
被引量:
2
1
作者
杨拥民
黎湘
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2012年第1期63-66,共4页
不可观测系统的部分状态可观测性对于大系统故障检测具有十分重要的意义。研究了基于部分可观测性的不可观测离散线性系统测点优化配置问题,证明了采用有限次观测值构造一个矩阵,可以给出部分可观测性成立的充分必要条件,并进一步证明...
不可观测系统的部分状态可观测性对于大系统故障检测具有十分重要的意义。研究了基于部分可观测性的不可观测离散线性系统测点优化配置问题,证明了采用有限次观测值构造一个矩阵,可以给出部分可观测性成立的充分必要条件,并进一步证明了部分可观测性的度量可以用一个矩阵的秩的特性来刻画。最后,给出了离散线性系统部分可观测性测试优化配置的度量指标。算例表明,提出的部分可观测性度量指标具有简单实用的特点。
展开更多
关键词
离散线
性
系统
部分可观测性
奇异值
测试优化配置
在线阅读
下载PDF
职称材料
基于隐式通信的值分解多智能体强化学习
2
作者
邓亚男
王秋红
+1 位作者
李俊杰
顾晶晶
《计算机科学与探索》
北大核心
2025年第7期1878-1887,共10页
在多智能体系统中,智能体通常只能观察到部分状态信息,导致每个智能体在作决策时缺乏对其他智能体行为和环境动态的完整理解,进而增加了协作的难度。虽然基于值函数分解的多智能体强化学习方法对解决局部可观测性问题有一定的优势,但由...
在多智能体系统中,智能体通常只能观察到部分状态信息,导致每个智能体在作决策时缺乏对其他智能体行为和环境动态的完整理解,进而增加了协作的难度。虽然基于值函数分解的多智能体强化学习方法对解决局部可观测性问题有一定的优势,但由于状态-动作空间维度高、模型结构复杂等问题,多智能体系统中仍然存在着协作不确定性的影响,从而导致奖励分配不公平的问题。提出了一种基于隐式通信的值分解多智能体强化学习方法(VFRL-IC),通过挖掘智能体之间的局部关系,缓解环境不确定性问题带来的影响:提出隐式通信框架,在训练阶段使智能体共享局部观测信息以训练局部策略;基于局部观测信息构建全局影响的评估模型,求解智能体间影响值;设计了一种类多头注意力机制的网络结构,融合智能体间影响值,求解包含全局信息的局部动作值模型。在星际争霸环境中进行实验验证,结果表明,VFRL-IC在各场景中的平均成功率优于基线算法15~40个百分点,效率提高18%。
展开更多
关键词
值分解
多智能体强化学习
部分可观测性
不确定
性
隐式通信
在线阅读
下载PDF
职称材料
题名
离散线性系统部分可观测性测试配置
被引量:
2
1
作者
杨拥民
黎湘
机构
国防科技大学装备综合保障技术重点实验室
国防科技大学电子科学与工程学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2012年第1期63-66,共4页
基金
国家部委资助项目(513270302)
文摘
不可观测系统的部分状态可观测性对于大系统故障检测具有十分重要的意义。研究了基于部分可观测性的不可观测离散线性系统测点优化配置问题,证明了采用有限次观测值构造一个矩阵,可以给出部分可观测性成立的充分必要条件,并进一步证明了部分可观测性的度量可以用一个矩阵的秩的特性来刻画。最后,给出了离散线性系统部分可观测性测试优化配置的度量指标。算例表明,提出的部分可观测性度量指标具有简单实用的特点。
关键词
离散线
性
系统
部分可观测性
奇异值
测试优化配置
Keywords
linear discrete system partial observability singular value measurement optimization
分类号
TP13 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于隐式通信的值分解多智能体强化学习
2
作者
邓亚男
王秋红
李俊杰
顾晶晶
机构
南京航空航天大学计算机科学与技术学院
出处
《计算机科学与探索》
北大核心
2025年第7期1878-1887,共10页
基金
国家自然科学基金(62072235)。
文摘
在多智能体系统中,智能体通常只能观察到部分状态信息,导致每个智能体在作决策时缺乏对其他智能体行为和环境动态的完整理解,进而增加了协作的难度。虽然基于值函数分解的多智能体强化学习方法对解决局部可观测性问题有一定的优势,但由于状态-动作空间维度高、模型结构复杂等问题,多智能体系统中仍然存在着协作不确定性的影响,从而导致奖励分配不公平的问题。提出了一种基于隐式通信的值分解多智能体强化学习方法(VFRL-IC),通过挖掘智能体之间的局部关系,缓解环境不确定性问题带来的影响:提出隐式通信框架,在训练阶段使智能体共享局部观测信息以训练局部策略;基于局部观测信息构建全局影响的评估模型,求解智能体间影响值;设计了一种类多头注意力机制的网络结构,融合智能体间影响值,求解包含全局信息的局部动作值模型。在星际争霸环境中进行实验验证,结果表明,VFRL-IC在各场景中的平均成功率优于基线算法15~40个百分点,效率提高18%。
关键词
值分解
多智能体强化学习
部分可观测性
不确定
性
隐式通信
Keywords
value function factorization
multi-agent reinforcement learning
partial observability
uncertainty
implicit communication
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
离散线性系统部分可观测性测试配置
杨拥民
黎湘
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2012
2
在线阅读
下载PDF
职称材料
2
基于隐式通信的值分解多智能体强化学习
邓亚男
王秋红
李俊杰
顾晶晶
《计算机科学与探索》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部