期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Agent仿真中具有先验知识的混合学习算法与混合结构模型
1
作者
郭晓军
杨建军
李红卫
《海军航空工程学院学报》
2007年第2期247-251,共5页
强化学习是一种有效的机器学习方法,是无监督学习,通过不断地和环境交互得到外部环境评价信号,选择合适的动作.Q学习是一种典型的强化学习,其学习效率较低,尤其是当状态空间和决策空间较大时.为提高Q学习学习效率和收敛速度,采用具有先...
强化学习是一种有效的机器学习方法,是无监督学习,通过不断地和环境交互得到外部环境评价信号,选择合适的动作.Q学习是一种典型的强化学习,其学习效率较低,尤其是当状态空间和决策空间较大时.为提高Q学习学习效率和收敛速度,采用具有先验知识的Q学习算法,利用模糊综合决策方法处理专家经验和环境信息得到Q学习的先验知识,对Q学习的初始状态进行优化;针对Agent个体学习与群体学习各自的不足,提出了采用混合学习算法,将个体学习与群体学习有效结合起来,提高了Agent的个体性能及系统整体的智能水平;同时为满足复杂适应性需求,采用Agent混合结构模型,在该模型中构造了基于知识的协调控制器,通过它来协调慎思式过程和反应式过程.
展开更多
关键词
多智能体系统
混合
学习算法
混合结构模型
在线阅读
下载PDF
职称材料
题名
Agent仿真中具有先验知识的混合学习算法与混合结构模型
1
作者
郭晓军
杨建军
李红卫
机构
海军航空工程学院控制工程系 海军航空工程学院研究生管理大队
出处
《海军航空工程学院学报》
2007年第2期247-251,共5页
文摘
强化学习是一种有效的机器学习方法,是无监督学习,通过不断地和环境交互得到外部环境评价信号,选择合适的动作.Q学习是一种典型的强化学习,其学习效率较低,尤其是当状态空间和决策空间较大时.为提高Q学习学习效率和收敛速度,采用具有先验知识的Q学习算法,利用模糊综合决策方法处理专家经验和环境信息得到Q学习的先验知识,对Q学习的初始状态进行优化;针对Agent个体学习与群体学习各自的不足,提出了采用混合学习算法,将个体学习与群体学习有效结合起来,提高了Agent的个体性能及系统整体的智能水平;同时为满足复杂适应性需求,采用Agent混合结构模型,在该模型中构造了基于知识的协调控制器,通过它来协调慎思式过程和反应式过程.
关键词
多智能体系统
混合
学习算法
混合结构模型
Keywords
multi-agent system
hybrid learning algorithm
hybrid architecture
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Agent仿真中具有先验知识的混合学习算法与混合结构模型
郭晓军
杨建军
李红卫
《海军航空工程学院学报》
2007
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部