摘要
研究一种两类品种工件混流的多站点传送带给料加工站系统的优化控制问题.系统中的站点如何协同工作完成工件加工任务,是提高系统生产率的重要课题.将前视距离作为各站点的决策变量,通过站点间的局部信息交互,提出一种品种均衡工作模式,并运用一种模型无关的串行反馈式多agent强化学习算法求解系统的最优策略.实验结果验证了该工作模式的合理性和算法的有效性,并分析了部分参数变化对系统性能的影响.
This paper is mainly concerned with the optimal control of multiple CSPS system with two-type product mixed flow. How the stations in the system work cooperatively to complete the machining task is one of the important subjects to improve productivity. An operating mode based on equilibrium of products is proposed by using look-ahead range as the control variable of each station and through the local information interaction between stations. A model-free multi-agent reinforcement learning algorithm is used to derive the optimal control policy. Simulation results show the rationality of the proposed operating mode and the effectiveness of the proposed algorithm, and the impact of different parameters on system performance is also analyzed.
出处
《控制与决策》
EI
CSCD
北大核心
2017年第9期1614-1620,共7页
Control and Decision
基金
国家自然科学基金面上项目(61174186
61573126
71231004)
教育部高等学校博士学科点专项科研基金项目(20130111110007)
教育部新世纪优秀人才计划项目(NCET-11-0626)
合肥工业大学应用科技成果培育计划项目(JZ2016YYPY0052)
作者简介
唐昊(1972-),男,教授,博士,从事离散事件动态系统、强化学习、神经元动态规划等研究;通讯作者.E—mail:htang@hfut.edu.cn
李博川(1990-),男,硕士生,从事离散事件动态系统、强化学习的研究.