期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种新的连续动作集学习自动机 被引量:2
1
作者 刘晓 毛宁 《数据采集与处理》 CSCD 北大核心 2015年第6期1310-1317,共8页
学习自动机(Learning automation,LA)是一种自适应决策器。其通过与一个随机环境不断交互学习从一个允许的动作集里选择最优的动作。在大多数传统的LA模型中,动作集总是被取作有限的。因此,对于连续参数学习问题,需要将动作空间离散化,... 学习自动机(Learning automation,LA)是一种自适应决策器。其通过与一个随机环境不断交互学习从一个允许的动作集里选择最优的动作。在大多数传统的LA模型中,动作集总是被取作有限的。因此,对于连续参数学习问题,需要将动作空间离散化,并且学习的精度取决于离散化的粒度。本文提出一种新的连续动作集学习自动机(Continuous action-set learning automaton,CALA),其动作集为一个可变区间,同时按照均匀分布方式选择输出动作。学习算法利用来自环境的二值反馈信号对动作区间的端点进行自适应更新。通过一个多模态学习问题的仿真实验,演示了新算法相对于3种现有CALA算法的优越性。 展开更多
关键词 机器学习 强化学习 在线学习 学习自动机 连续动作集学习自动机
在线阅读 下载PDF
基于CARLA-PSO组合模型的智能控制器参数学习优化 被引量:4
2
作者 谷学静 张明儒 +1 位作者 王志良 郭宇承 《计算机应用研究》 CSCD 北大核心 2019年第3期677-680,共4页
对连续动作强化学习自动机(CARLA)进行了改进,应用改进后的CARLA结合粒子群优化算法(PSO)优化PID参数。以CARLA为基础,建立了CARLA和PSO的组合优化学习模型CARLA-PSO,该模型包含CAR-LA学习环路和PSO学习环路两个部分,通过优化策略选择... 对连续动作强化学习自动机(CARLA)进行了改进,应用改进后的CARLA结合粒子群优化算法(PSO)优化PID参数。以CARLA为基础,建立了CARLA和PSO的组合优化学习模型CARLA-PSO,该模型包含CAR-LA学习环路和PSO学习环路两个部分,通过优化策略选择器进行学习环路的选择,通过与环境进行相互作用,获得最优控制。对连铸结晶器液位控制进行了仿真实验,实验结果表明,CARLA-PSO在进行PID参数优化时寻优效率高,全局搜索能力强,能够达到理想的控制效果,具有较好的应用前景。 展开更多
关键词 连续动作学习强化自动机 粒子群优化算法 智能PID控制器 结晶器液位
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部