如何看待自学3天的阿法元100：0完爆阿法狗？

来源：互联网发布：软件商店安装编辑：程序博客网时间：2024/06/09 08:05

点击有惊喜

Deepmind在如约在Nature发布了一篇名为《Mastering the game of Go without human knowledge》（不使用人类知识掌握围棋）的论文，在这篇重磅论文中，详细介绍了谷歌 DeepMind 团队最新的研究成果。人工智能的一项重要目标，是在没有任何先验知识的前提下，通过完全的自学，在极具挑战的领域，达到超人的境地。
nature

去年，有个小孩读遍人世所有的棋谱，辛勤打谱，苦思冥想，棋艺精进，4-1 打败世界冠军李世石，从此人间无敌手。他的名字叫阿法狗。
TIM_20171020113751

今年，他的弟弟只靠一副棋盘和黑白两子，没看过一个棋谱，也没有一个人指点，从零开始，自娱自乐，自己参悟，100-0 打败哥哥阿法狗。他的名字叫阿法元。

阿尔法元的最大亮点，在于无需任何人类指导，通过全新的强化学习方式自己成为自己的老师，在围棋这一最具挑战性的领域达到超过人类的精通程度。

人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero)，完全从零开始，不需要任何历史棋谱的指引，更不需要参考人类任何的先验知识，完全靠自己一个人强化学习(reinforcement learning)和参悟，棋艺增长远超阿法狗，百战百胜，以 100-0 击溃阿法狗。

达到这样一个水准，阿法元只需要在 4 个 TPU 上，花三天时间，自己左右互搏 490 万棋局。而它的哥哥阿法狗，需要在 48 个 TPU 上，花几个月的时间，学习三千万棋局，才打败人类。

点击有惊喜

阅读全文

0 0