你也能与AlphaGo谈笑风生:AlphaGo教学工具上线,2万多变化,37万多步棋

来源:互联网 发布:大庆seo推广 编辑:程序博客网 时间:2024/05/23 01:59

eb02f939a0419794f7e4100e63c85fb8c1641a97

我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。

博原文如下

樊麾在微博表示:

“大家好

AlphaGo 教学工具终于上线了。

教学工具共有两万多个变化,三十七万多步棋组成,通过AlphaGo的视角,分析并建议围棋开局的诸多下法。同时每步棋AlphaGo都会给出自己的胜率分析,希望AlphaGo对围棋的独特理解可以给我们一些启发。

下边的几个图是我从万千变化图中发现比较有冲击力的几个,类似的变化图有很多很多,大家可以自己找找

本教学工具使用的版本是 AlphaGo Master。具体信息可以在主页上看到,工具设有包括中文简体在内的多个语言。

顺序由左往右,图1 :原来二路虎不见得好! 图2 :对付迷你中国流的新办法!图3 :这个! 图4 : 小林流也不是只有大飞挂! 图5 : 原来这里还可以飞!图6 :妖刀定式!

温馨提示 :打开时请耐心等待几秒。

祝大家玩得开心”

DeepMind资深研究员黄士杰

黄士杰博士:

大家好,很高兴向大家宣布,AlphaGo教学工具上线了。

这是一个AlphaGo教学的开局库,相关细节如下:

  1. 本教学工具总共收录了约6000个近代围棋史上主要的开局变化,从23万个人类棋谱中收集而来。
  2. 所有盘面都有AlphaGo评价的胜率,以及AlphaGo推荐的下法。
  3. 所有AlphaGo的胜率与推荐下法,AlphaGo都思考将近10分钟(1000万次模拟)。
  4. 每一个开局变化,AlphaGo都固定延伸20步棋。加上AlphaGo的下法,整个教学工具约有2万个分支变化,37万个盘面。

受限于投稿《自然》杂志的时程,本教学工具使用的版本是AlphaGo Master。希望大家享受AlphaGo教学工具中的创新下法,也能从中有所收获。

AlphaGo、AlphaGo zero、AlphaZero

2016年Google在Nature上发表基于深度学习算法的围棋程序AlphaGo,AlphaGo在古老的围棋比赛中以4:1的高分击败了世界大师级冠军李世石,从此一炮而红,并且二度登上《Nature》杂志封面。

许多专家认为,人类至少提前十年实现了这一壮举。对于 DeepMind以及世界围棋界而言,最激动人心的是AlphaGo在博弈过程中所表现出来的创造力,甚至有时候它的招数对古老的围棋智慧都造成了挑战。

不到一年之后,2017年Google的DeepMind实验室再度开发了基于强化学习的新一代围棋程序,称为AlphaGo zero,AlphaGo Zero不依赖任何对局复盘和实战数据进行训练,仅用3天就击败 AlphaGo Lee、仅用40天就击败 AlphaGo Master的围棋人工智能。

12月份,DeepMind推出AlphaZero,从AlphoGo Zero 到AlphaZero只是少了一个词“围棋”(Go), 但是背后却代表着Hassabis将和他的DeepMind继续朝着“创造解决世界上一切问题的通用人工智能”这一目标道路上迈出了巨大的一步。

Alpha Zero与前面几种程序相比更具通用性。除了围棋以外,它在国际象棋和日本将棋上的造诣也已经超越了人类水平。因此Alpha Zero 也从名字里去掉了围棋(Go)一词。DeepMind在arXiv发表论文表示其开发的通用强化学习程序AlphaZero,使用蒙特卡洛树搜索(MCTS)和深度神经网络,和强大的算力,同时在国际象棋,日本将棋和围棋中战胜各自领域的最强代表。而且这一切都是通过自我对弈完成的,在训练中除了游戏规则,不提供任何额外的领域知识。4小时击败最强国际象棋AI、2小时击败最强将棋AI,8小时击败李世石版AlphaGo,连最强围棋AI AlphaGo Zero也不能幸免:训练34小时的AlphaZero胜过了训练72小时的AlphaGo Zero。

原文链接
原创粉丝点击