期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用 被引量:2
1
作者 周雷 孔凤 +1 位作者 唐昊 张建军 《控制理论与应用》 EI CAS CSCD 北大核心 2011年第11期1665-1670,共6页
研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系... 研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度. 展开更多
关键词 传送带给料生产加工站 小脑模型关节控制器 Q学习 在线策略迭代
在线阅读 下载PDF
可变服务率模式下基于需求驱动的传送带给料加工站系统的优化控制 被引量:2
2
作者 唐昊 许玲玲 +1 位作者 周雷 谭琦 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第6期810-816,共7页
本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,... 本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,将其最优控制问题描述为半马尔科夫决策过程(SMDP)模型.该模型为利用策略迭代等方法求解系统在平均准则或折扣准则下的最优控制策略提供了理论基础,特别地,据此可引入基于模拟退火思想的Q学习算法等优化方法来寻求近似解,以克服理论求解过程中的维数灾和建模难等困难.仿真结果说明了本文建立的数学模型及给出的优化方法的有效性. 展开更多
关键词 传送带给料加工 可变服务率 半马尔科夫决策过程 Q学习
在线阅读 下载PDF
服务率不确定的单站点传送带给料加工站系统鲁棒优化控制
3
作者 黄浩 唐昊 +1 位作者 周雷 程文娟 《计算机应用》 CSCD 北大核心 2015年第7期2067-2072,共6页
研究了服务率不确定情况下的单站点传送带给料加工站(CSPS)系统的鲁棒优化控制问题。在仅知服务率区间的条件下,以CSPS系统的前视距离作为控制变量,将鲁棒优化控制问题建模成不确定参数的半马尔可夫决策过程(SMDP)的极大极小优化问题,... 研究了服务率不确定情况下的单站点传送带给料加工站(CSPS)系统的鲁棒优化控制问题。在仅知服务率区间的条件下,以CSPS系统的前视距离作为控制变量,将鲁棒优化控制问题建模成不确定参数的半马尔可夫决策过程(SMDP)的极大极小优化问题,在状态相关的情况下,给出全局优化算法进行鲁棒控制策略求解。首先,运用遗传算法求解固定策略下的最差性能值;其次,根据求解得到的最差性能值,运用模拟退火算法求解最优鲁棒控制策略。仿真结果表明,服务率不确定的CSPS系统的最优鲁棒性能代价与服务率固定为区间中值系统的最优性能代价相差不大,并且随着不确定区间的缩小,两者的差值越小,说明了全局优化算法的有效性。 展开更多
关键词 传送带给料加工 半马尔可夫决策过程 不确定服务率 全局优化 鲁棒控制策略
在线阅读 下载PDF
基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制 被引量:8
4
作者 唐昊 万海峰 +1 位作者 韩江洪 周雷 《自动化学报》 EI CSCD 北大核心 2010年第2期289-296,共8页
研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每... 研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每个Agent的原始性能函数进行改进,引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能);并运用性能势理论,构建一种适用于平均和折扣两种性能准则的Wolf-PHC多Agent学习算法,以求解决策时刻不同步的多站点的协作Look-ahead控制策略.最后,论文通过仿真实验验证了该算法的有效性,学习结果表明,通过性能函数的改进,各工作站的负载平衡性得到改善,整个系统的工件处理率也明显提高. 展开更多
关键词 传送带给料生产加工站 Look-ahead控制 多AGENT强化学习 性能函数
在线阅读 下载PDF
非泊松工件流CSPS系统的Q学习算法适用性仿真研究 被引量:1
5
作者 苏娜 唐昊 +2 位作者 戴飞 王彬 周雷 《控制理论与应用》 EI CAS CSCD 北大核心 2020年第12期2591-2600,共10页
研究工件非泊松到达情况下,传送带给料加工站(CSPS)系统无法建立成半马尔可夫决策过程(SMDP)模型时, Q学习算法的适用性问题.首先,以马尔可夫调制泊松过程(MMPP)和半马尔可夫调制泊松过程(SMMPP)来模拟非泊松工件流,并在相同的平均到达... 研究工件非泊松到达情况下,传送带给料加工站(CSPS)系统无法建立成半马尔可夫决策过程(SMDP)模型时, Q学习算法的适用性问题.首先,以马尔可夫调制泊松过程(MMPP)和半马尔可夫调制泊松过程(SMMPP)来模拟非泊松工件流,并在相同的平均到达率下,仿真评估其Q学习算法性能,并分别与泊松工件流情况下的Q学习算法性能进行比较:其次,在非泊松工件流情况下,观测以实时统计平均到达率作为工件标准泊松到达率的理论优化情况:最后讨论在MMPP和SMMPP叠加混合非泊松工件流情况下CSPS系统的Q学习算法性能.实验表明,在工件非泊松到达情况下Q学习算法依然能学到较好的控制策略,从而说明了CSPS系统中Q学习算法的适用性. 展开更多
关键词 传送带给料加工 马尔可夫调制泊松过程 半马尔可夫调制泊松过程 Q学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部