期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种多重优先经验回放的麻将游戏数据利用方法 被引量:2
1
作者 李淑琴 李奕 《重庆理工大学学报(自然科学)》 CAS 北大核心 2022年第12期162-169,共8页
针对大众麻将AI训练时经验回放机制中样本均匀采样导致训练缓慢的问题,提出了一种多重优先经验回放算法,即从时序差分误差、局面复杂程度、动作即时奖励3个维度对经验样本进行优先级标记,每次采样时优先级高的样本高概率被抽取来更新神... 针对大众麻将AI训练时经验回放机制中样本均匀采样导致训练缓慢的问题,提出了一种多重优先经验回放算法,即从时序差分误差、局面复杂程度、动作即时奖励3个维度对经验样本进行优先级标记,每次采样时优先级高的样本高概率被抽取来更新神经网络。为了验证算法的有效性,构建了大众麻将自博弈平台进行相应的实验验证。实验结果表明:相比随机经验回放方法,新方法将麻将AI的训练速度提升了22.5%。 展开更多
关键词 大众麻将 多重优先经验回放 时序差分误差 自博弈
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部