期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
结合神经网络的改进UCT在国际跳棋中的应用 被引量:7
1
作者 王亚杰 祁冰枝 +1 位作者 张云博 丁傲冬 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第7期259-265,共7页
针对UCT算法的准确性受搜索次数影响较大的问题,提出一种结合神经网络的改进UCT算法。利用神经网络输出每一步的平均行动价值Q,结合改进的UCT算法寻找搜索过程中的高潜力节点。将传统UCT搜索改进为3个阶段:首先,通过已训练好的神经网络... 针对UCT算法的准确性受搜索次数影响较大的问题,提出一种结合神经网络的改进UCT算法。利用神经网络输出每一步的平均行动价值Q,结合改进的UCT算法寻找搜索过程中的高潜力节点。将传统UCT搜索改进为3个阶段:首先,通过已训练好的神经网络模型和UCT算法对当前所有子节点进行初次搜索,获得高潜力子节点;其次,利用剪枝操作去掉部分子节点,提升被搜索节点的质量;最后,二次搜索保留的高潜力子节点获得最优策略。另外,在分次搜索的过程中引入节点保留数量因子R和搜索比例因子P,辅助分次搜索,增加搜索的有效性。将其引入国际跳棋游戏中,实验结果表明:改进后的算法与其他算法相比胜率有所提升,验证了该算法的可行性。 展开更多
关键词 UCT算法 MCTS 剪枝 分次搜索 神经网络 机器博弈 国际跳棋
在线阅读 下载PDF
不均匀光照下的通用棋子定位方法 被引量:4
2
作者 王亚杰 张云博 +2 位作者 吴燕燕 丁傲冬 祁冰枝 《计算机应用》 CSCD 北大核心 2020年第12期3490-3498,共9页
针对下棋机器人系统中光照分布不均匀造成的棋子定位误差问题,提出了基于分块凸包检测和图像掩膜的通用棋子定位方法。首先,提取出棋盘轮廓上的点集,利用分块凸包法检测棋盘四个顶点的坐标;然后,定义标准棋盘图像中四个棋盘顶点的坐标,... 针对下棋机器人系统中光照分布不均匀造成的棋子定位误差问题,提出了基于分块凸包检测和图像掩膜的通用棋子定位方法。首先,提取出棋盘轮廓上的点集,利用分块凸包法检测棋盘四个顶点的坐标;然后,定义标准棋盘图像中四个棋盘顶点的坐标,根据透视变换原理计算转换矩阵;其次,根据不同类型棋盘的小方格面积差异来识别棋盘类型;最后,将捕获到的棋盘图像陆续矫正为标准棋盘图像,获得相邻两个标准棋盘图像的差分图,并对差分图进行膨胀、图像掩膜相乘和腐蚀的操作,从而得到棋子有效区域并计算其中心坐标。实验结果表明:所提方法在四种光照不均匀情况下对围棋和象棋棋子的平均定位准确率可达到95.5%和99.06%,相较于其他棋子定位算法有明显的提升,并且解决了棋子粘连、棋子投影和镜头畸变导致的局部棋子定位不精准的问题。 展开更多
关键词 棋子定位 光照不均匀 角点检测 图像掩膜 凸包 棋盘识别 下棋机器人
在线阅读 下载PDF
基于预期收益策略与UCT的德州扑克算法 被引量:3
3
作者 王亚杰 丁傲冬 +1 位作者 祁冰枝 张云博 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第3期166-173,共8页
针对虚拟遗憾最小化算法和传统上限置信区间算法等过于依赖领域知识或者需要大量对局记录训练的问题,以二人无限注德州扑克为研究对象,提出了基于预期收益策略的改进UCT算法。首先,使用蒙特卡罗方法即多次随机生成对方底牌和未知公共牌... 针对虚拟遗憾最小化算法和传统上限置信区间算法等过于依赖领域知识或者需要大量对局记录训练的问题,以二人无限注德州扑克为研究对象,提出了基于预期收益策略的改进UCT算法。首先,使用蒙特卡罗方法即多次随机生成对方底牌和未知公共牌,然后比较双方牌型大小,计算己方胜率;其次,根据己方胜率和己方动作下注量计算预期收益并根据每个动作的预期收益,选择一个最大的动作作为下一步;最后,根据己方胜率与对手下注量评估对手胜率,从而将预期收益策略作为对手策略模型应用在传统UCT算法中。在开局筹码量为20 000的情况下,改进后的UCT算法与基于预期收益策略实现的德州扑克程序THPZZ进行100局的对弈,平均每局赢得的筹码量为655,水平显著高于THPZZ。 展开更多
关键词 UCT算法 蒙特卡罗 德州扑克 预期收益 对手胜率评估 非完备信息博弈
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部