检索结果-维普期刊中文期刊服务平台

基于动态贝叶斯网络的多Agent交互的模型表示被引量：6: 1; 作者姚宏亮王浩胡学刚《计算机工程》 CAS CSCD 北大核心 2003年第16期57-59,共3页; 动态贝叶斯网络(Dynamic Bayesian Networks，DBNs)是对具有随机过程性质的不确定性问题进行建模和处理的一个有力工具。该文将Agents技术和DBNs相结合来对两个以上的人的行为进行建模。提出一种分解和合并的方法来解决两个以上的Agent... 展开更多; 关键词动态贝叶斯网络多AGENT系统隐含马尔可夫模型影响图; 在线阅读下载PDF 职称材料

1(1/2)片联合树算法在动态贝叶斯网精确推理中的应用被引量：3: 2; 作者周本达王浩姚宏亮《计算机工程与应用》 CSCD 北大核心 2005年第14期81-84,共4页; 基于动态贝叶斯网络处理动态不确定性问题的过程中推理是非常重要的,而推理算法的优劣决定着推理的执行效率。该文提出一种较简单的112片联合树算法,在不需要限制消去顺序且只作一次扩展的条件下构造联合树,所以算法简单且具有较小的复... 展开更多; 关键词动态贝叶斯网络(DBNs) 联合树马尔可夫模型; 在线阅读下载PDF 职称材料

基于内部结构MPoMDP模型的策略梯度学习算法被引量：1: 3; 作者张润梅王浩 +2 位作者张佑生姚宏亮方长胜《计算机工程与应用》 CSCD 北大核心 2009年第7期20-23,共4页; 为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示Agent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agent内部变量集的局部因式形式,以提高模型的推理效率。将GPI-PO... 展开更多; 关键词马尔可夫决策过程强化学习 MPOMDP模型策略梯度算法; 在线阅读下载PDF 职称材料

使用基于值规则的协作图实现多agent的动作选择被引量：1: 4; 作者王骋王浩方宝富《计算机工程与应用》 CSCD 北大核心 2004年第19期61-62,65,共3页; 多agent系统的一个关键性的问题就是多agent之间的协作,即一组agent需要选择出一个联合动作,使得整体效用最大化。该文提出了基于值规则的协作图,并改进了变量消减算法,使用它们可以实现多agent在通信条件受到限制的离散状态空间里进行... 展开更多; 关键词多AGENT 协作图值规则变量消减算法; 在线阅读下载PDF 职称材料

题名基于动态贝叶斯网络的多Agent交互的模型表示被引量：6: 1; 作者姚宏亮王浩胡学刚; 机构合肥工业大学计算机科学技术系; 出处《计算机工程》 CAS CSCD 北大核心 2003年第16期57-59,共3页; 基金国家自然科学基金项目(69985004) 安徽省教委基金项目(2000j1168zd); 文摘动态贝叶斯网络(Dynamic Bayesian Networks，DBNs)是对具有随机过程性质的不确定性问题进行建模和处理的一个有力工具。该文将Agents技术和DBNs相结合来对两个以上的人的行为进行建模。提出一种分解和合并的方法来解决两个以上的Agents构成的DBNs的模型表示在计算上的难以处理性，同时还提高了模型的表示能力，且能表示变量之间互为因果的关系。; 关键词动态贝叶斯网络多AGENT系统隐含马尔可夫模型影响图; Keywords Dynamic bayesian networks(DBNs) Multi-agent system(MAS) Hidden Markov models(HMMs) Influence diagrams(IDs); 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名1(1/2)片联合树算法在动态贝叶斯网精确推理中的应用被引量：3: 2; 作者周本达王浩姚宏亮; 机构合肥工业大学计算机科学技术系皖西学院数学系; 出处《计算机工程与应用》 CSCD 北大核心 2005年第14期81-84,共4页; 基金安徽省自然科学基金项目(编号:03042305)资助; 文摘基于动态贝叶斯网络处理动态不确定性问题的过程中推理是非常重要的,而推理算法的优劣决定着推理的执行效率。该文提出一种较简单的112片联合树算法,在不需要限制消去顺序且只作一次扩展的条件下构造联合树,所以算法简单且具有较小的复杂度。; 关键词动态贝叶斯网络(DBNs) 联合树马尔可夫模型; Keywords Dynamic Bayesian Networks(DBNs),junction tree,Markov models; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于内部结构MPoMDP模型的策略梯度学习算法被引量：1: 3; 作者张润梅王浩张佑生姚宏亮方长胜; 机构合肥工业大学计算机与科学技术系安徽建筑工业学院电子与信息工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2009年第7期20-23,共4页; 基金国家自然科学基金No.60705015 安徽省自然科学基金No.070412064 安徽省教育厅自然科学重点项目~~; 文摘为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示Agent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agent内部变量集的局部因式形式,以提高模型的推理效率。将GPI-POMDP算法扩展到基于内部结构的MPOMDP模型中,给出基于内部状态的多Agent策略梯度算法(MIS-GPOMDP),来求解基于内部结构的MPOMDP。实验结果表明MIS-GPOMDP算法具有较高的推理效率,且算法是收敛的。; 关键词马尔可夫决策过程强化学习 MPOMDP模型策略梯度算法; Keywords Markov Decision Processes（MDP） reinforcement learning MPOMDP model policy gradient algorithm; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名使用基于值规则的协作图实现多agent的动作选择被引量：1: 4; 作者王骋王浩方宝富; 机构合肥工业大学计算机科学技术系; 出处《计算机工程与应用》 CSCD 北大核心 2004年第19期61-62,65,共3页; 基金安徽省自然科学基金资助(编号:03042305); 文摘多agent系统的一个关键性的问题就是多agent之间的协作,即一组agent需要选择出一个联合动作,使得整体效用最大化。该文提出了基于值规则的协作图,并改进了变量消减算法,使用它们可以实现多agent在通信条件受到限制的离散状态空间里进行动作选择。; 关键词多AGENT 协作图值规则变量消减算法; Keywords multi-agents,coordination graph,value rule,variable elimination algo rithm; 分类号 TP301 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料