欢迎使用CSDN-markdown编辑器

来源:互联网 发布:兴趣图谱源码 编辑:程序博客网 时间:2024/06/09 14:40

Monte Carlo Tree Search

围棋的空间太大,很难用树形结构全部罗列展开,比如MinMax,所以用Monte Carlo Tree Search 对某个节点之后的情况进行随机模拟

这里写图片描述

Multi-Armed Bandit Problem

这个是著名的老虎机问题

这里写图片描述

xi代表玩第i台老虎机平均赢到的钱,后面根式里的表达式让算法有机会去尝试其他机器。如果一直玩同一台机器的话,n和ni都都会变大,根式里面会变小。对于其他机器来说n变大因为没有玩,ni不变,所以整体就会变大,所以程序就会跳去玩其他机器。

这里写图片描述

这里是利用CNN来训练网络下围棋的示意图    

训练CNN下围棋

原创粉丝点击