基于强化学习的多Agent系统被引量：7

The Multi-Agent System Based on Reinforcement Learning

在线阅读下载PDF

导出

摘要 Reinforcement learning allows agent that has no knowledge of an environment to cooperate more efficacious each other. This paper presents an approach for developing multi-agent reinforcement learning systems based on equation principle. The experiment shows agent can produces the desired behavior under all kinds of situation. Reinforcement learning allows agent that has no knowledge of an environment to cooperate more efficacious each other. This paper presents an approach for developing multi-agent reinforcement learning systems based on equation principle. The experiment shows agent can produces the desired behavior under all kinds of situation.

作者唐文彬朱淼良

机构地区浙江大学人工智能研究所

出处《计算机科学》 CSCD 北大核心 2003年第4期16-18,共3页 Computer Science

基金国防科工委"十五"攻关项目基金"智能机器人"

关键词多AGENT系统人工智能强化学习学习算法 Agent,Reinforcement learning,EDP,Equation principle

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献12

1王文杰,田启家,史忠植.多主体系统中对其它主体的研究[J].计算机研究与发展,1998,35(11):971-974. 被引量：7
2朱淼良,张新晖,吴春明,钱徽.自主机器人自组织结构IRASO的仿真研究[J].计算机研究与发展,1999,36(7):776-782. 被引量：6
3Watkins C J C H. Learning from Delayed Rewards:[Ph.D.thesis]. Cambridge University, 1989.
4Watkins C J C H. Dayan P. Technical not:Q-learning. Machine Learning, 1992,8:279~292.
5Ohashi T ,et al. State transition rate based reinforcement learning Systems, Man, and Cybernetics. In: 2000 IEEE Intl. Cord.Volume: 1, 2000. 236~241.
6Yamagnchi T,et al. Propagating learned behaviors from a virtual agent to a physical robot in reinforcement learnins, In..Proe. IEEE Int. Conf. on Evolutionary Computation, 1996. 855~859.
7Yamagnchi T,et al. Reinforcement learning for a real robot in a real environment. In: European Conf. on Artificial Intelligence,Aug. 1996. 694~698.
8Hailu G. Sommer G. Embedding knowledge in reinforcement·learning. In: Proc. 8^th Int. Conf. on Artificial Neural Networks.Sep. 1998. 1133~1138.
9Huber M. A hybrid architecture for hierarchical reinforcement learning. In: Proc. IEEE Int. Conf. on Robotics & Automation,April 2000. 3290~3295.
10Peng J, Bhanu B. Closed loop object recognition using reinforcement learning. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1998,20(2) : 139~154.

二级参考文献3

1史忠植，高级人工智能，1997年
2田启家，博士学位论文，1996年
3Chun W H，SPIE.Proc Mobile Robot IX，1995年，180页

共引文献11

1陆为民,郭健,韩文秀.应用CORBA和多代理技术的集成供电企业信息系统[J].天津大学学报（社会科学版）,2005,7(1):16-19.
2周熠,陈小平.隐式愿望及其形式化[J].软件学报,2005,16(5):771-778. 被引量：1
3钱徽.一种机器人多传感器联合系统的逻辑和代数分析方法[J].传感技术学报,2005,18(3):540-546.
4钱徽,吴春明,朱淼良.基于可重构体系的多机器人共享模块剩余能力估计[J].电子学报,2005,33(11):1969-1972. 被引量：5
5张宏,何华灿.换位原理与几个模态特征公式的有效性[J].计算机科学,2006,33(8):184-186.
6殷炳叶,马礼,王韬.基于MAS的多机器人路径规划研究与应用[J].机械工程与自动化,2007(5):108-110. 被引量：2
7林怡青,郑时雄.机器人群体合作的信念分析[J].机器人,2000,22(5):350-353. 被引量：4
8蒙祖强,蔡自兴.基于主控流动的多级Multi-Agent系统[J].计算机工程与应用,2001,37(13):13-15. 被引量：1
9胡霞.论多主体系统的语用推理[J].贵州工程应用技术学院学报,2015,33(1):31-35.
10唐文彬,朱淼良.基于Micro-agent的自主机器人车辆[J].计算机工程,2003,29(10):19-20.

同被引文献45

1叶菲,罗景青,俞志富.一种改进的并行处理SVM学习算法[J].微电子学与计算机,2009,26(2):40-43. 被引量：6
2张彦铎,闵锋.基于人工神经网络的强化学习在机器人足球中的应用[J].哈尔滨工业大学学报,2004,36(7):859-861. 被引量：7
3于功弟.DSS的新决策方法——模糊决策法的应用[J].计算机工程,1993,19(2):20-23. 被引量：2
4宋清昆,胡子婴.基于经验知识的Q-学习算法[J].自动化技术与应用,2006,25(11):10-12. 被引量：7
5郭锐,吴敏,彭军,彭姣,曹卫华.一种新的多智能体Q学习算法[J].自动化学报,2007,33(4):367-372. 被引量：13
6Bevan Jarvis,Dennis Jarvis,Lakhmi Jain.TEAMS IN MULTIAGENT SYSTEMS[J].Intelligent Information Processing Ⅲ,2006:1 - 10.
7Suton R S.Learning to predict by the methods of temporal differences[J].Machine Learning, 1988,(3):9-44.
8Jim Duggan. Equation-based policy optimization for agentoriented system dynamics models[J].System Dynamics Review Volume,2008,24(1):98-118.
9MitchellTM著曾华军张银奎译.机器学习[M].北京:机械工业出版社,2003..
10何炎祥陈莘萌.Agent和多Agent系统的设计和应用[M].武汉：武汉大学出版社,2001..

引证文献7

1杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
2钟茂生,廖辉传,谢勇.面向用户兴趣的Web信息过滤系统[J].广西师范大学学报（自然科学版）,2006,24(4):171-174. 被引量：3
3宋清昆,胡子婴.基于经验知识的Q-学习算法[J].自动化技术与应用,2006,25(11):10-12. 被引量：7
4王娜,王国宇,孟庆春,殷波.基于Agent的智能交通系统的控制建模[J].计算机应用研究,2007,24(1):103-106. 被引量：6
5战忠丽,王强,王佩霞.多Agent系统中Q学习算法研究[J].辽宁农业职业技术学院学报,2008,10(5):48-50.
6陈玉明,张广明,赵英凯.基于混合Q学习的多Agent系统[J].制造业自动化,2010,32(9):61-63.
7连志刚,高叶军,焦斌.基于学习算法的离散型制造业生产能力平衡技术[J].安徽大学学报（自然科学版）,2013,37(2):19-24.

二级引证文献36

1郭晓军,杨建军,李红卫.Agent仿真中具有先验知识的混合学习算法与混合结构模型[J].海军航空工程学院学报,2007,22(2):247-251.
2何涛,白振兴.多智能体系统设计的关键技术研究[J].现代电子技术,2006,29(14):31-34. 被引量：2
3王惠,符策,谢益武,许瑞雪,杨小佳.面向伙伴选择的模糊Markov博弈控制及仿真研究[J].系统仿真学报,2007,19(15):3572-3576. 被引量：1
4韩伟,韩忠愿.基于黑板模型的多智能体合作学习[J].计算机工程,2007,33(22):42-44. 被引量：5
5韩伟.基于边界样本协调的多智能体合作学习[J].模式识别与人工智能,2008,21(1):111-115.
6张伟华,隽志才,高林杰.活动—出行决策混合仿真方法研究综述[J].计算机应用研究,2008,25(7):1928-1931. 被引量：1
7毛俊杰,刘国栋.基于先验知识的改进强化学习及其在MAS中应用[J].计算机工程与应用,2008,44(24):156-158. 被引量：2
8李红梅,严正.具有先验知识的Q学习算法在AGC中的应用[J].电力系统自动化,2008,32(23):36-40. 被引量：10
9余芳,张海涛.基于Multi-agent的交通控制协调算法研究[J].自动化技术与应用,2008,27(12):5-8. 被引量：1
10宋春晖,雷景生,赵思轩.基于本体的信息过滤需求模型构造[J].广西师范大学学报（自然科学版）,2008,26(4):71-74. 被引量：5

1童亮,陆际联.Multi-Agent Reinforcement Learning Algorithm Based on Action Prediction[J].Journal of Beijing Institute of Technology,2006,15(2):133-137.
2LIU Changan LIU Fei LIU Chunyang WU Hua.Multi-agent Reinforcement Learning Based on K-Means Algorithm[J].Chinese Journal of Electronics,2011,20(3):414-418.
3杨玉君,程君实,陈佳品.Multi-agent reinforcement learning with cooperation based on eligibility traces[J].Journal of Harbin Institute of Technology(New Series),2004,11(5):564-568.
4The Capacity to Cooperate[J].ChinAfrica,2015,7(12):24-27.
5王新,徐炀,张少华.基于UVM的Arinc-429协议验证方法[J].江苏科技信息,2017,34(2):58-59. 被引量：1
6liuke_blue.构造自己的“SSDT”绕过主动防御[J].黑客防线,2010(7):352-354.
7BGP and AMD Cooperate for Seismic Data Processing[J].China Oil & Gas,2009,16(1):60-60.
8LI GANG.Cooperate via G20 for Shared Prosperity[J].China Today,2016,65(9):52-53.
9Liu Yanzhong,Pan Caixia,Chen Yingyi,Sun Chuanren,Wang Lin.Fault Diagnosis System for Aquaculture Networking Based on Neural Network[J].Animal Husbandry and Feed Science,2016,8(1):39-43.
10Min Fang,Frans C.A. Groen.Collaborative multi-agent reinforcement learning based on experience propagation[J].Journal of Systems Engineering and Electronics,2013,24(4):683-689. 被引量：5

计算机科学

2003年第4期

浏览历史

内容加载中请稍等...

基于强化学习的多Agent系统被引量：7

参考文献12

二级参考文献3

共引文献11

同被引文献45

引证文献7

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于强化学习的多Agent系统 被引量：7

参考文献12

二级参考文献3

共引文献11

同被引文献45

引证文献7

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于强化学习的多Agent系统被引量：7