期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于动态贝叶斯网络的多Agent交互的模型表示 被引量:6
1
作者 姚宏亮 王浩 胡学刚 《计算机工程》 CAS CSCD 北大核心 2003年第16期57-59,共3页
动态贝叶斯网络(Dynamic Bayesian Networks,DBNs)是对具有随机过程性质的不确定性问题进行建模和处理的一个有力工具。该文将Agents技术和DBNs相结合来对两个以上的人的行为进行建模。提出一种分解和合并的方法来解决两个以上的Agent... 动态贝叶斯网络(Dynamic Bayesian Networks,DBNs)是对具有随机过程性质的不确定性问题进行建模和处理的一个有力工具。该文将Agents技术和DBNs相结合来对两个以上的人的行为进行建模。提出一种分解和合并的方法来解决两个以上的Agents构成的DBNs的模型表示在计算上的难以处理性,同时还提高了模型的表示能力,且能表示变量之间互为因果的关系。 展开更多
关键词 动态贝叶斯网络 多AGENT系统 隐含马尔可夫模型 影响图
在线阅读 下载PDF
1(1/2)片联合树算法在动态贝叶斯网精确推理中的应用 被引量:3
2
作者 周本达 王浩 姚宏亮 《计算机工程与应用》 CSCD 北大核心 2005年第14期81-84,共4页
基于动态贝叶斯网络处理动态不确定性问题的过程中推理是非常重要的,而推理算法的优劣决定着推理的执行效率。该文提出一种较简单的112片联合树算法,在不需要限制消去顺序且只作一次扩展的条件下构造联合树,所以算法简单且具有较小的复... 基于动态贝叶斯网络处理动态不确定性问题的过程中推理是非常重要的,而推理算法的优劣决定着推理的执行效率。该文提出一种较简单的112片联合树算法,在不需要限制消去顺序且只作一次扩展的条件下构造联合树,所以算法简单且具有较小的复杂度。 展开更多
关键词 动态贝叶斯网络(DBNs) 联合树 马尔可夫模型
在线阅读 下载PDF
基于内部结构MPoMDP模型的策略梯度学习算法 被引量:1
3
作者 张润梅 王浩 +2 位作者 张佑生 姚宏亮 方长胜 《计算机工程与应用》 CSCD 北大核心 2009年第7期20-23,共4页
为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示Agent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agent内部变量集的局部因式形式,以提高模型的推理效率。将GPI-PO... 为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示Agent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agent内部变量集的局部因式形式,以提高模型的推理效率。将GPI-POMDP算法扩展到基于内部结构的MPOMDP模型中,给出基于内部状态的多Agent策略梯度算法(MIS-GPOMDP),来求解基于内部结构的MPOMDP。实验结果表明MIS-GPOMDP算法具有较高的推理效率,且算法是收敛的。 展开更多
关键词 马尔可夫决策过程 强化学习 MPOMDP模型 策略梯度算法
在线阅读 下载PDF
使用基于值规则的协作图实现多agent的动作选择 被引量:1
4
作者 王骋 王浩 方宝富 《计算机工程与应用》 CSCD 北大核心 2004年第19期61-62,65,共3页
多agent系统的一个关键性的问题就是多agent之间的协作,即一组agent需要选择出一个联合动作,使得整体效用最大化。该文提出了基于值规则的协作图,并改进了变量消减算法,使用它们可以实现多agent在通信条件受到限制的离散状态空间里进行... 多agent系统的一个关键性的问题就是多agent之间的协作,即一组agent需要选择出一个联合动作,使得整体效用最大化。该文提出了基于值规则的协作图,并改进了变量消减算法,使用它们可以实现多agent在通信条件受到限制的离散状态空间里进行动作选择。 展开更多
关键词 多AGENT 协作图 值规则 变量消减算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部