期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
实时格斗游戏的智能决策方法
被引量:
3
1
作者
唐振韬
梁荣钦
+1 位作者
朱圆恒
赵冬斌
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022年第6期969-985,共17页
格斗游戏作为实时双人零和对抗博弈的代表性问题,具有实时对抗和快速响应的重要研究特性.相应针对性方法的提出有效反映了游戏人工智能领域的重要研究进展及发展方向.本文以格斗游戏人工智能竞赛作为研究背景,将智能决策方法分为启发式...
格斗游戏作为实时双人零和对抗博弈的代表性问题,具有实时对抗和快速响应的重要研究特性.相应针对性方法的提出有效反映了游戏人工智能领域的重要研究进展及发展方向.本文以格斗游戏人工智能竞赛作为研究背景,将智能决策方法分为启发式规则型、统计前向规划型与深度强化学习型三大类型,介绍相应的智能决策方法在实时格斗游戏中的研究进展.为分析格斗游戏智能决策方法的表现性能,本文提出了胜率、剩余血量、执行速率、优势性和伤害性的5个性能因子,系统分析智能决策方法的性能优势及不足.最后,对未来的在格斗游戏中研究发展趋势进行展望.
展开更多
关键词
实时格斗游戏
统计前向规划
深度强化学习
性能因子
智能决策
在线阅读
下载PDF
职称材料
基于对手池的两人格斗游戏深度强化学习
2
作者
梁荣钦
朱圆恒
赵冬斌
《控制理论与应用》
北大核心
2025年第2期226-234,共9页
双人游戏在游戏人工智能领域是一个基本且重要的问题,其中一对一零和格斗游戏是最为典型的双人游戏之一.本文基于深度强化学习对格斗游戏博弈对抗策略进行研究.首先建模格斗游戏环境,设计可用于格斗游戏决策的状态、动作以及奖赏函数,...
双人游戏在游戏人工智能领域是一个基本且重要的问题,其中一对一零和格斗游戏是最为典型的双人游戏之一.本文基于深度强化学习对格斗游戏博弈对抗策略进行研究.首先建模格斗游戏环境,设计可用于格斗游戏决策的状态、动作以及奖赏函数,并将阶段策略梯度算法应用于对抗策略的学习.为了尽可能学到纳什均衡策略实现战胜任意对手的目标,本文设计了基于历年参赛的智能体构造对手池用于智能体训练,并探索对手选择机制对于训练过程的影响.最后在固定对手池的基础上,设计了自增长对手池算法,以提升对手策略的完备性和训练智能体的鲁棒性.为了提高环境采样速度,本文从传统并行框架出发,设计了可用于双人游戏的多服务器分布式并行采样框架.通过实验对比发现,基于自增长对手池方法所学的智能体能以96.6%的胜率击败固定对手池中的智能体,并且在与3个仅用于测试的智能体对战时,也表现出了72.2%的胜率.
展开更多
关键词
实时格斗游戏
深度强化学习
两人零和博弈
对手策略池
在线阅读
下载PDF
职称材料
题名
实时格斗游戏的智能决策方法
被引量:
3
1
作者
唐振韬
梁荣钦
朱圆恒
赵冬斌
机构
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
中国科学院大学人工智能学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022年第6期969-985,共17页
基金
科技部科技创新2030“新一代人工智能”重大项目(2018AAA0101005)
中国科学院战略性先导研究项目(XDA27030400)
中国科学院青年创新促进会项目(2021132)资助.
文摘
格斗游戏作为实时双人零和对抗博弈的代表性问题,具有实时对抗和快速响应的重要研究特性.相应针对性方法的提出有效反映了游戏人工智能领域的重要研究进展及发展方向.本文以格斗游戏人工智能竞赛作为研究背景,将智能决策方法分为启发式规则型、统计前向规划型与深度强化学习型三大类型,介绍相应的智能决策方法在实时格斗游戏中的研究进展.为分析格斗游戏智能决策方法的表现性能,本文提出了胜率、剩余血量、执行速率、优势性和伤害性的5个性能因子,系统分析智能决策方法的性能优势及不足.最后,对未来的在格斗游戏中研究发展趋势进行展望.
关键词
实时格斗游戏
统计前向规划
深度强化学习
性能因子
智能决策
Keywords
real-time fighting game
statistical forward planning
deep reinforcement learning
key metric
intelligent decision
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于对手池的两人格斗游戏深度强化学习
2
作者
梁荣钦
朱圆恒
赵冬斌
机构
中国科学院大学
中国科学院自动化研究所
出处
《控制理论与应用》
北大核心
2025年第2期226-234,共9页
基金
科技创新2030“新一代人工智能”重大项目(2018AAA0102404)
中国科学院战略性先导研究项目(XDA27030400)
+1 种基金
国家自然科学基金项目(62293541,62136008)
中国科学院青年创新促进会项目(2021132)资助.
文摘
双人游戏在游戏人工智能领域是一个基本且重要的问题,其中一对一零和格斗游戏是最为典型的双人游戏之一.本文基于深度强化学习对格斗游戏博弈对抗策略进行研究.首先建模格斗游戏环境,设计可用于格斗游戏决策的状态、动作以及奖赏函数,并将阶段策略梯度算法应用于对抗策略的学习.为了尽可能学到纳什均衡策略实现战胜任意对手的目标,本文设计了基于历年参赛的智能体构造对手池用于智能体训练,并探索对手选择机制对于训练过程的影响.最后在固定对手池的基础上,设计了自增长对手池算法,以提升对手策略的完备性和训练智能体的鲁棒性.为了提高环境采样速度,本文从传统并行框架出发,设计了可用于双人游戏的多服务器分布式并行采样框架.通过实验对比发现,基于自增长对手池方法所学的智能体能以96.6%的胜率击败固定对手池中的智能体,并且在与3个仅用于测试的智能体对战时,也表现出了72.2%的胜率.
关键词
实时格斗游戏
深度强化学习
两人零和博弈
对手策略池
Keywords
real-time fighting game
deep reinforcement learning
two-player zero-sum game
opponent policy pool
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
实时格斗游戏的智能决策方法
唐振韬
梁荣钦
朱圆恒
赵冬斌
《控制理论与应用》
EI
CAS
CSCD
北大核心
2022
3
在线阅读
下载PDF
职称材料
2
基于对手池的两人格斗游戏深度强化学习
梁荣钦
朱圆恒
赵冬斌
《控制理论与应用》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部