你也能与AlphaGo谈笑风生：AlphaGo教学工具上线，2万多变化，37万多步棋

来源：互联网发布：大庆seo推广编辑：程序博客网时间：2024/05/23 01:59

eb02f939a0419794f7e4100e63c85fb8c1641a97

我有几张阿里云幸运券分享给你，用券购买或者升级阿里云相应产品会有特惠惊喜哦！把想要买的产品的幸运券都领走吧！快下手，马上就要抢光了。

微博原文如下

樊麾在微博表示：

“大家好

AlphaGo 教学工具终于上线了。

教学工具共有两万多个变化，三十七万多步棋组成，通过AlphaGo的视角，分析并建议围棋开局的诸多下法。同时每步棋AlphaGo都会给出自己的胜率分析，希望AlphaGo对围棋的独特理解可以给我们一些启发。

下边的几个图是我从万千变化图中发现比较有冲击力的几个，类似的变化图有很多很多，大家可以自己找找

本教学工具使用的版本是 AlphaGo Master。具体信息可以在主页上看到，工具设有包括中文简体在内的多个语言。

顺序由左往右，图1 ：原来二路虎不见得好！图2 ：对付迷你中国流的新办法！图3 ：这个！图4 ：小林流也不是只有大飞挂！图5 ：原来这里还可以飞！图6 ：妖刀定式！

温馨提示：打开时请耐心等待几秒。

祝大家玩得开心”

DeepMind资深研究员黄士杰

黄士杰博士：

大家好，很高兴向大家宣布，AlphaGo教学工具上线了。

这是一个AlphaGo教学的开局库，相关细节如下：

本教学工具总共收录了约6000个近代围棋史上主要的开局变化，从23万个人类棋谱中收集而来。
所有盘面都有AlphaGo评价的胜率，以及AlphaGo推荐的下法。
所有AlphaGo的胜率与推荐下法，AlphaGo都思考将近10分钟（1000万次模拟）。
每一个开局变化，AlphaGo都固定延伸20步棋。加上AlphaGo的下法，整个教学工具约有2万个分支变化，37万个盘面。

受限于投稿《自然》杂志的时程，本教学工具使用的版本是AlphaGo Master。希望大家享受AlphaGo教学工具中的创新下法，也能从中有所收获。

AlphaGo、AlphaGo zero、AlphaZero

2016年Google在Nature上发表基于深度学习算法的围棋程序AlphaGo，AlphaGo在古老的围棋比赛中以4:1的高分击败了世界大师级冠军李世石，从此一炮而红，并且二度登上《Nature》杂志封面。

许多专家认为，人类至少提前十年实现了这一壮举。对于 DeepMind以及世界围棋界而言，最激动人心的是AlphaGo在博弈过程中所表现出来的创造力，甚至有时候它的招数对古老的围棋智慧都造成了挑战。

不到一年之后，2017年Google的DeepMind实验室再度开发了基于强化学习的新一代围棋程序，称为AlphaGo zero，AlphaGo Zero不依赖任何对局复盘和实战数据进行训练，仅用3天就击败 AlphaGo Lee、仅用40天就击败 AlphaGo Master的围棋人工智能。

12月份，DeepMind推出AlphaZero，从AlphoGo Zero 到AlphaZero只是少了一个词“围棋”(Go), 但是背后却代表着Hassabis将和他的DeepMind继续朝着“创造解决世界上一切问题的通用人工智能”这一目标道路上迈出了巨大的一步。

Alpha Zero与前面几种程序相比更具通用性。除了围棋以外，它在国际象棋和日本将棋上的造诣也已经超越了人类水平。因此Alpha Zero 也从名字里去掉了围棋（Go）一词。DeepMind在arXiv发表论文表示其开发的通用强化学习程序AlphaZero,使用蒙特卡洛树搜索（MCTS）和深度神经网络，和强大的算力，同时在国际象棋，日本将棋和围棋中战胜各自领域的最强代表。而且这一切都是通过自我对弈完成的，在训练中除了游戏规则，不提供任何额外的领域知识。4小时击败最强国际象棋AI、2小时击败最强将棋AI，8小时击败李世石版AlphaGo，连最强围棋AI AlphaGo Zero也不能幸免：训练34小时的AlphaZero胜过了训练72小时的AlphaGo Zero。

原文链接

阅读全文

0 0