期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
结合神经网络的改进UCT在国际跳棋中的应用
被引量:
7
1
作者
王亚杰
祁冰枝
+1 位作者
张云博
丁傲冬
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021年第7期259-265,共7页
针对UCT算法的准确性受搜索次数影响较大的问题,提出一种结合神经网络的改进UCT算法。利用神经网络输出每一步的平均行动价值Q,结合改进的UCT算法寻找搜索过程中的高潜力节点。将传统UCT搜索改进为3个阶段:首先,通过已训练好的神经网络...
针对UCT算法的准确性受搜索次数影响较大的问题,提出一种结合神经网络的改进UCT算法。利用神经网络输出每一步的平均行动价值Q,结合改进的UCT算法寻找搜索过程中的高潜力节点。将传统UCT搜索改进为3个阶段:首先,通过已训练好的神经网络模型和UCT算法对当前所有子节点进行初次搜索,获得高潜力子节点;其次,利用剪枝操作去掉部分子节点,提升被搜索节点的质量;最后,二次搜索保留的高潜力子节点获得最优策略。另外,在分次搜索的过程中引入节点保留数量因子R和搜索比例因子P,辅助分次搜索,增加搜索的有效性。将其引入国际跳棋游戏中,实验结果表明:改进后的算法与其他算法相比胜率有所提升,验证了该算法的可行性。
展开更多
关键词
UCT算法
MCTS
剪枝
分次搜索
神经网络
机器博弈
国际跳棋
在线阅读
下载PDF
职称材料
不均匀光照下的通用棋子定位方法
被引量:
4
2
作者
王亚杰
张云博
+2 位作者
吴燕燕
丁傲冬
祁冰枝
《计算机应用》
CSCD
北大核心
2020年第12期3490-3498,共9页
针对下棋机器人系统中光照分布不均匀造成的棋子定位误差问题,提出了基于分块凸包检测和图像掩膜的通用棋子定位方法。首先,提取出棋盘轮廓上的点集,利用分块凸包法检测棋盘四个顶点的坐标;然后,定义标准棋盘图像中四个棋盘顶点的坐标,...
针对下棋机器人系统中光照分布不均匀造成的棋子定位误差问题,提出了基于分块凸包检测和图像掩膜的通用棋子定位方法。首先,提取出棋盘轮廓上的点集,利用分块凸包法检测棋盘四个顶点的坐标;然后,定义标准棋盘图像中四个棋盘顶点的坐标,根据透视变换原理计算转换矩阵;其次,根据不同类型棋盘的小方格面积差异来识别棋盘类型;最后,将捕获到的棋盘图像陆续矫正为标准棋盘图像,获得相邻两个标准棋盘图像的差分图,并对差分图进行膨胀、图像掩膜相乘和腐蚀的操作,从而得到棋子有效区域并计算其中心坐标。实验结果表明:所提方法在四种光照不均匀情况下对围棋和象棋棋子的平均定位准确率可达到95.5%和99.06%,相较于其他棋子定位算法有明显的提升,并且解决了棋子粘连、棋子投影和镜头畸变导致的局部棋子定位不精准的问题。
展开更多
关键词
棋子定位
光照不均匀
角点检测
图像掩膜
凸包
棋盘识别
下棋机器人
在线阅读
下载PDF
职称材料
基于预期收益策略与UCT的德州扑克算法
被引量:
3
3
作者
王亚杰
丁傲冬
+1 位作者
祁冰枝
张云博
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021年第3期166-173,共8页
针对虚拟遗憾最小化算法和传统上限置信区间算法等过于依赖领域知识或者需要大量对局记录训练的问题,以二人无限注德州扑克为研究对象,提出了基于预期收益策略的改进UCT算法。首先,使用蒙特卡罗方法即多次随机生成对方底牌和未知公共牌...
针对虚拟遗憾最小化算法和传统上限置信区间算法等过于依赖领域知识或者需要大量对局记录训练的问题,以二人无限注德州扑克为研究对象,提出了基于预期收益策略的改进UCT算法。首先,使用蒙特卡罗方法即多次随机生成对方底牌和未知公共牌,然后比较双方牌型大小,计算己方胜率;其次,根据己方胜率和己方动作下注量计算预期收益并根据每个动作的预期收益,选择一个最大的动作作为下一步;最后,根据己方胜率与对手下注量评估对手胜率,从而将预期收益策略作为对手策略模型应用在传统UCT算法中。在开局筹码量为20 000的情况下,改进后的UCT算法与基于预期收益策略实现的德州扑克程序THPZZ进行100局的对弈,平均每局赢得的筹码量为655,水平显著高于THPZZ。
展开更多
关键词
UCT算法
蒙特卡罗
德州扑克
预期收益
对手胜率评估
非完备信息博弈
在线阅读
下载PDF
职称材料
题名
结合神经网络的改进UCT在国际跳棋中的应用
被引量:
7
1
作者
王亚杰
祁冰枝
张云博
丁傲冬
机构
沈阳航空航天大学工程训练中心
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021年第7期259-265,共7页
基金
辽宁省兴辽英才计划项目(XLYC1906003)。
文摘
针对UCT算法的准确性受搜索次数影响较大的问题,提出一种结合神经网络的改进UCT算法。利用神经网络输出每一步的平均行动价值Q,结合改进的UCT算法寻找搜索过程中的高潜力节点。将传统UCT搜索改进为3个阶段:首先,通过已训练好的神经网络模型和UCT算法对当前所有子节点进行初次搜索,获得高潜力子节点;其次,利用剪枝操作去掉部分子节点,提升被搜索节点的质量;最后,二次搜索保留的高潜力子节点获得最优策略。另外,在分次搜索的过程中引入节点保留数量因子R和搜索比例因子P,辅助分次搜索,增加搜索的有效性。将其引入国际跳棋游戏中,实验结果表明:改进后的算法与其他算法相比胜率有所提升,验证了该算法的可行性。
关键词
UCT算法
MCTS
剪枝
分次搜索
神经网络
机器博弈
国际跳棋
Keywords
UCT algorithm
MCTS
pruning
hierarchical simulation
neural network
machine game
checkers
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
不均匀光照下的通用棋子定位方法
被引量:
4
2
作者
王亚杰
张云博
吴燕燕
丁傲冬
祁冰枝
机构
沈阳航空航天大学工程训练中心
沈阳航空航天大学计算机学院
出处
《计算机应用》
CSCD
北大核心
2020年第12期3490-3498,共9页
基金
航空科学基金资助项目(2015ZC54008)
辽宁省兴辽英才计划项目(XLYC1906003)。
文摘
针对下棋机器人系统中光照分布不均匀造成的棋子定位误差问题,提出了基于分块凸包检测和图像掩膜的通用棋子定位方法。首先,提取出棋盘轮廓上的点集,利用分块凸包法检测棋盘四个顶点的坐标;然后,定义标准棋盘图像中四个棋盘顶点的坐标,根据透视变换原理计算转换矩阵;其次,根据不同类型棋盘的小方格面积差异来识别棋盘类型;最后,将捕获到的棋盘图像陆续矫正为标准棋盘图像,获得相邻两个标准棋盘图像的差分图,并对差分图进行膨胀、图像掩膜相乘和腐蚀的操作,从而得到棋子有效区域并计算其中心坐标。实验结果表明:所提方法在四种光照不均匀情况下对围棋和象棋棋子的平均定位准确率可达到95.5%和99.06%,相较于其他棋子定位算法有明显的提升,并且解决了棋子粘连、棋子投影和镜头畸变导致的局部棋子定位不精准的问题。
关键词
棋子定位
光照不均匀
角点检测
图像掩膜
凸包
棋盘识别
下棋机器人
Keywords
chess piece positioning
uneven illumination
corner detection
image mask
convex hull
chessboard recognition
chess robot
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于预期收益策略与UCT的德州扑克算法
被引量:
3
3
作者
王亚杰
丁傲冬
祁冰枝
张云博
机构
沈阳航空航天大学工程训练中心
沈阳航空航天大学计算机学院
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021年第3期166-173,共8页
基金
辽宁省兴辽英才计划项目(XLYC1906003)。
文摘
针对虚拟遗憾最小化算法和传统上限置信区间算法等过于依赖领域知识或者需要大量对局记录训练的问题,以二人无限注德州扑克为研究对象,提出了基于预期收益策略的改进UCT算法。首先,使用蒙特卡罗方法即多次随机生成对方底牌和未知公共牌,然后比较双方牌型大小,计算己方胜率;其次,根据己方胜率和己方动作下注量计算预期收益并根据每个动作的预期收益,选择一个最大的动作作为下一步;最后,根据己方胜率与对手下注量评估对手胜率,从而将预期收益策略作为对手策略模型应用在传统UCT算法中。在开局筹码量为20 000的情况下,改进后的UCT算法与基于预期收益策略实现的德州扑克程序THPZZ进行100局的对弈,平均每局赢得的筹码量为655,水平显著高于THPZZ。
关键词
UCT算法
蒙特卡罗
德州扑克
预期收益
对手胜率评估
非完备信息博弈
Keywords
UCT algorithm
Monte Carlo
Texas Hold’em poker
expected revenue
opponent winning evaluation
incomplete information game
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
结合神经网络的改进UCT在国际跳棋中的应用
王亚杰
祁冰枝
张云博
丁傲冬
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021
7
在线阅读
下载PDF
职称材料
2
不均匀光照下的通用棋子定位方法
王亚杰
张云博
吴燕燕
丁傲冬
祁冰枝
《计算机应用》
CSCD
北大核心
2020
4
在线阅读
下载PDF
职称材料
3
基于预期收益策略与UCT的德州扑克算法
王亚杰
丁傲冬
祁冰枝
张云博
《重庆理工大学学报(自然科学)》
CAS
北大核心
2021
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部