如何看待自学3天的阿法元100:0完爆阿法狗?

来源:互联网 发布:软件商店安装 编辑:程序博客网 时间:2024/06/09 08:05

点击有惊喜


Deepmind在如约在Nature发布了一篇名为《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋)的论文,在这篇重磅论文中,详细介绍了谷歌 DeepMind 团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。
nature

去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1 打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。
TIM_20171020113751

今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0 打败哥哥阿法狗。他的名字叫阿法元。

阿尔法元的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。

人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,棋艺增长远超阿法狗,百战百胜,以 100-0 击溃阿法狗。

达到这样一个水准,阿法元只需要在 4 个 TPU 上,花三天时间,自己左右互搏 490 万棋局。而它的哥哥阿法狗,需要在 48 个 TPU 上,花几个月的时间,学习三千万棋局,才打败人类。


点击有惊喜


原创粉丝点击