期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种多重优先经验回放的麻将游戏数据利用方法
被引量:
2
1
作者
李淑琴
李奕
《重庆理工大学学报(自然科学)》
CAS
北大核心
2022年第12期162-169,共8页
针对大众麻将AI训练时经验回放机制中样本均匀采样导致训练缓慢的问题,提出了一种多重优先经验回放算法,即从时序差分误差、局面复杂程度、动作即时奖励3个维度对经验样本进行优先级标记,每次采样时优先级高的样本高概率被抽取来更新神...
针对大众麻将AI训练时经验回放机制中样本均匀采样导致训练缓慢的问题,提出了一种多重优先经验回放算法,即从时序差分误差、局面复杂程度、动作即时奖励3个维度对经验样本进行优先级标记,每次采样时优先级高的样本高概率被抽取来更新神经网络。为了验证算法的有效性,构建了大众麻将自博弈平台进行相应的实验验证。实验结果表明:相比随机经验回放方法,新方法将麻将AI的训练速度提升了22.5%。
展开更多
关键词
大众麻将
多重优先经验回放
时序差分误差
自博弈
在线阅读
下载PDF
职称材料
题名
一种多重优先经验回放的麻将游戏数据利用方法
被引量:
2
1
作者
李淑琴
李奕
机构
北京信息科技大学计算机学院
感知与计算智能联合实验室
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2022年第12期162-169,共8页
基金
北京信息科技大学科技项目(5212010937,KM201911232002)。
文摘
针对大众麻将AI训练时经验回放机制中样本均匀采样导致训练缓慢的问题,提出了一种多重优先经验回放算法,即从时序差分误差、局面复杂程度、动作即时奖励3个维度对经验样本进行优先级标记,每次采样时优先级高的样本高概率被抽取来更新神经网络。为了验证算法的有效性,构建了大众麻将自博弈平台进行相应的实验验证。实验结果表明:相比随机经验回放方法,新方法将麻将AI的训练速度提升了22.5%。
关键词
大众麻将
多重优先经验回放
时序差分误差
自博弈
Keywords
popular mahjong
multidimensional priority experience replay
temporal differential error
self-game
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种多重优先经验回放的麻将游戏数据利用方法
李淑琴
李奕
《重庆理工大学学报(自然科学)》
CAS
北大核心
2022
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部