检索结果-维普期刊中文期刊服务平台

小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量：2: 1; 作者周雷孔凤 +1 位作者唐昊张建军《控制理论与应用》 EI CAS CSCD 北大核心 2011年第11期1665-1670,共6页; 研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系... 展开更多; 关键词传送带给料生产加工站小脑模型关节控制器 Q学习在线策略迭代; 在线阅读下载PDF 职称材料

可变服务率模式下基于需求驱动的传送带给料加工站系统的优化控制被引量：2: 2; 作者唐昊许玲玲 +1 位作者周雷谭琦《控制理论与应用》 EI CAS CSCD 北大核心 2015年第6期810-816,共7页; 本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,... 展开更多; 关键词传送带给料加工站可变服务率半马尔科夫决策过程 Q学习; 在线阅读下载PDF 职称材料

服务率不确定的单站点传送带给料加工站系统鲁棒优化控制: 3; 作者黄浩唐昊 +1 位作者周雷程文娟《计算机应用》 CSCD 北大核心 2015年第7期2067-2072,共6页; 研究了服务率不确定情况下的单站点传送带给料加工站(CSPS)系统的鲁棒优化控制问题。在仅知服务率区间的条件下,以CSPS系统的前视距离作为控制变量,将鲁棒优化控制问题建模成不确定参数的半马尔可夫决策过程(SMDP)的极大极小优化问题,... 展开更多; 关键词传送带给料加工站半马尔可夫决策过程不确定服务率全局优化鲁棒控制策略; 在线阅读下载PDF 职称材料

基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制被引量：8: 4; 作者唐昊万海峰 +1 位作者韩江洪周雷《自动化学报》 EI CSCD 北大核心 2010年第2期289-296,共8页; 研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每... 展开更多; 关键词传送带给料生产加工站 Look-ahead控制多AGENT强化学习性能函数; 在线阅读下载PDF 职称材料

非泊松工件流CSPS系统的Q学习算法适用性仿真研究被引量：1: 5; 作者苏娜唐昊 +2 位作者戴飞王彬周雷《控制理论与应用》 EI CAS CSCD 北大核心 2020年第12期2591-2600,共10页; 研究工件非泊松到达情况下,传送带给料加工站(CSPS)系统无法建立成半马尔可夫决策过程(SMDP)模型时, Q学习算法的适用性问题.首先,以马尔可夫调制泊松过程(MMPP)和半马尔可夫调制泊松过程(SMMPP)来模拟非泊松工件流,并在相同的平均到达... 展开更多; 关键词传送带给料加工站马尔可夫调制泊松过程半马尔可夫调制泊松过程 Q学习; 在线阅读下载PDF 职称材料

题名小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量：2: 1; 作者周雷孔凤唐昊张建军; 机构合肥工业大学计算机与信息学院安全关键工业测控技术教育部工程研究中心; 出处《控制理论与应用》 EI CAS CSCD 北大核心 2011年第11期1665-1670,共6页; 基金国家自然科学基金资助项目(60873003 61174186) +4 种基金 KJ2011A230) 中日国际科技合作资助项目(2011FA10440); 文摘研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度.; 关键词传送带给料生产加工站小脑模型关节控制器 Q学习在线策略迭代; Keywords conveyor-serviced production station cerebellar model articulation controller Q-learning online policy iteration; 分类号 TP13 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名可变服务率模式下基于需求驱动的传送带给料加工站系统的优化控制被引量：2: 2; 作者唐昊许玲玲周雷谭琦; 机构合肥工业大学电气与自动化工程学院合肥工业大学计算机与信息学院; 出处《控制理论与应用》 EI CAS CSCD 北大核心 2015年第6期810-816,共7页; 基金国家自然科学基金项目(61174186 61374158 +3 种基金 71231004) 高等学校博士学科点专项科研基金项目(20130111110007)资助~~; 文摘本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,将其最优控制问题描述为半马尔科夫决策过程(SMDP)模型.该模型为利用策略迭代等方法求解系统在平均准则或折扣准则下的最优控制策略提供了理论基础,特别地,据此可引入基于模拟退火思想的Q学习算法等优化方法来寻求近似解,以克服理论求解过程中的维数灾和建模难等困难.仿真结果说明了本文建立的数学模型及给出的优化方法的有效性.; 关键词传送带给料加工站可变服务率半马尔科夫决策过程 Q学习; Keywords conveyor-serviced production station changeable service rate semi-Markov decision process Q-learning; 分类号 O232 [理学—运筹学与控制论]; 在线阅读下载PDF 职称材料

题名服务率不确定的单站点传送带给料加工站系统鲁棒优化控制: 3; 作者黄浩唐昊周雷程文娟; 机构合肥工业大学计算机与信息学院合肥工业大学电气与自动化工程学院; 出处《计算机应用》 CSCD 北大核心 2015年第7期2067-2072,共6页; 基金国家自然科学基金资助项目(61174186 61374158 +2 种基金 51274078) 高等学校博士学科点专项科研基金资助项目(20130111110007); 文摘研究了服务率不确定情况下的单站点传送带给料加工站(CSPS)系统的鲁棒优化控制问题。在仅知服务率区间的条件下,以CSPS系统的前视距离作为控制变量,将鲁棒优化控制问题建模成不确定参数的半马尔可夫决策过程(SMDP)的极大极小优化问题,在状态相关的情况下,给出全局优化算法进行鲁棒控制策略求解。首先,运用遗传算法求解固定策略下的最差性能值;其次,根据求解得到的最差性能值,运用模拟退火算法求解最优鲁棒控制策略。仿真结果表明,服务率不确定的CSPS系统的最优鲁棒性能代价与服务率固定为区间中值系统的最优性能代价相差不大,并且随着不确定区间的缩小,两者的差值越小,说明了全局优化算法的有效性。; 关键词传送带给料加工站半马尔可夫决策过程不确定服务率全局优化鲁棒控制策略; Keywords conveyor-serviced production station Semi-Markov Decision Process （SMDP） uncertain service rate global optimization robust control policy; 分类号 TP202 [自动化与计算机技术—检测技术与自动化装置] TP273.5 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制被引量：8: 4; 作者唐昊万海峰韩江洪周雷; 机构合肥工业大学计算机与信息学院安全关键工业测控技术教育部工程研究中心; 出处《自动化学报》 EI CSCD 北大核心 2010年第2期289-296,共8页; 基金国家自然科学基金项目(60873003) 教育部留学回国人员科研启动基金 +1 种基金安徽省自然科学基金(090412046) 安徽高校省级自然科学研究重点项目(KJ2008A058)资助~~; 文摘研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每个Agent的原始性能函数进行改进,引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能);并运用性能势理论,构建一种适用于平均和折扣两种性能准则的Wolf-PHC多Agent学习算法,以求解决策时刻不同步的多站点的协作Look-ahead控制策略.最后,论文通过仿真实验验证了该算法的有效性,学习结果表明,通过性能函数的改进,各工作站的负载平衡性得到改善,整个系统的工件处理率也明显提高.; 关键词传送带给料生产加工站 Look-ahead控制多AGENT强化学习性能函数; Keywords Conveyor-serviced production station （CSPS） look-ahead control multi-agent reinforcement learning performance function; 分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名非泊松工件流CSPS系统的Q学习算法适用性仿真研究被引量：1: 5; 作者苏娜唐昊戴飞王彬周雷; 机构合肥工业大学电气与自动化工程学院合肥工业大学计算机与信息学院; 出处《控制理论与应用》 EI CAS CSCD 北大核心 2020年第12期2591-2600,共10页; 基金国家自然科学基金项目(61573126) 国家重点研发计划项目(2017YFGH002010) 中央高校基本科研业务费项目(JZ2016YYPY0052)资助。; 文摘研究工件非泊松到达情况下,传送带给料加工站(CSPS)系统无法建立成半马尔可夫决策过程(SMDP)模型时, Q学习算法的适用性问题.首先,以马尔可夫调制泊松过程(MMPP)和半马尔可夫调制泊松过程(SMMPP)来模拟非泊松工件流,并在相同的平均到达率下,仿真评估其Q学习算法性能,并分别与泊松工件流情况下的Q学习算法性能进行比较:其次,在非泊松工件流情况下,观测以实时统计平均到达率作为工件标准泊松到达率的理论优化情况:最后讨论在MMPP和SMMPP叠加混合非泊松工件流情况下CSPS系统的Q学习算法性能.实验表明,在工件非泊松到达情况下Q学习算法依然能学到较好的控制策略,从而说明了CSPS系统中Q学习算法的适用性.; 关键词传送带给料加工站马尔可夫调制泊松过程半马尔可夫调制泊松过程 Q学习; Keywords conveyor-serviced production station Markov modulation Poisson process semi-Markovian modulation Poisson process Q-learning algorithm; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP242 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用	周雷孔凤唐昊张建军	《控制理论与应用》 EI CAS CSCD 北大核心	2011	2	在线阅读下载PDF 职称材料
2	可变服务率模式下基于需求驱动的传送带给料加工站系统的优化控制	唐昊许玲玲周雷谭琦	《控制理论与应用》 EI CAS CSCD 北大核心	2015	2	在线阅读下载PDF 职称材料
3	服务率不确定的单站点传送带给料加工站系统鲁棒优化控制	黄浩唐昊周雷程文娟	《计算机应用》 CSCD 北大核心	2015	0	在线阅读下载PDF 职称材料
4	基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制	唐昊万海峰韩江洪周雷	《自动化学报》 EI CSCD 北大核心	2010	8	在线阅读下载PDF 职称材料
5	非泊松工件流CSPS系统的Q学习算法适用性仿真研究	苏娜唐昊戴飞王彬周雷	《控制理论与应用》 EI CAS CSCD 北大核心	2020	1	在线阅读下载PDF 职称材料