期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
AODE中基于强化学习的Agent协商模型
被引量:
14
1
作者
王立春
高阳
陈世福
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001年第2期135-141,共7页
AODE是我们研制的一个面向Agent的智能系统开发环境 .AODE中基于强化学习的Agent协商模型采用Markov决策过程和连续决策过程分别描述系统状态变化和特定系统状态的Agent协商过程 ,并将强化学习技术应用于Agent协商过程 .该协商模型能够...
AODE是我们研制的一个面向Agent的智能系统开发环境 .AODE中基于强化学习的Agent协商模型采用Markov决策过程和连续决策过程分别描述系统状态变化和特定系统状态的Agent协商过程 ,并将强化学习技术应用于Agent协商过程 .该协商模型能够描述动态环境下的多Agent协商 ,模型中所有Agent都采用元对策Q 学习算法时 ,系统能获得动态协商环境下的最优协商解 .
展开更多
关键词
多Agnet
系统
强化学习
Agent协商模型
AODE
智能系统开发环境
协商策略
在线阅读
下载PDF
职称材料
题名
AODE中基于强化学习的Agent协商模型
被引量:
14
1
作者
王立春
高阳
陈世福
机构
南京大学计算机软件新技术国家重点实验室南京大学计算机科学与技术系
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001年第2期135-141,共7页
基金
国家自然科学基金! ( 6990 50 0 1 )
高等学校博士点基金! ( 970 2 84 2 8)
文摘
AODE是我们研制的一个面向Agent的智能系统开发环境 .AODE中基于强化学习的Agent协商模型采用Markov决策过程和连续决策过程分别描述系统状态变化和特定系统状态的Agent协商过程 ,并将强化学习技术应用于Agent协商过程 .该协商模型能够描述动态环境下的多Agent协商 ,模型中所有Agent都采用元对策Q 学习算法时 ,系统能获得动态协商环境下的最优协商解 .
关键词
多Agnet
系统
强化学习
Agent协商模型
AODE
智能系统开发环境
协商策略
Keywords
multi agent system, negotiation, reinforcement learning
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
AODE中基于强化学习的Agent协商模型
王立春
高阳
陈世福
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001
14
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部