如何看待自学3天的阿法元100:0完爆阿法狗?
来源:互联网 发布:软件商店安装 编辑:程序博客网 时间:2024/06/09 08:05
点击有惊喜
Deepmind在如约在Nature发布了一篇名为《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋)的论文,在这篇重磅论文中,详细介绍了谷歌 DeepMind 团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。
去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1 打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0 打败哥哥阿法狗。他的名字叫阿法元。
阿尔法元的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。
人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,棋艺增长远超阿法狗,百战百胜,以 100-0 击溃阿法狗。
达到这样一个水准,阿法元只需要在 4 个 TPU 上,花三天时间,自己左右互搏 490 万棋局。而它的哥哥阿法狗,需要在 48 个 TPU 上,花几个月的时间,学习三千万棋局,才打败人类。
点击有惊喜
阅读全文
0 0
- 如何看待自学3天的阿法元100:0完爆阿法狗?
- 如何看待自己的专业?
- 如何看待java的this???
- 如何看待优秀的山东电视台
- 日本人如何看待中国的反日游行
- 如何看待用户需求的频繁变更
- 如何看待编程语言的排名
- 如何看待编程语言的排名
- 我的美国老板如何看待H1N1
- 如何看待别人写的“心得,总结”
- 如何看待别人写的“心得,总结”
- 如何看待系统分析师的考试
- 如何看待人生与技术的价值
- 如何看待人生与技术的价值
- 如何看待人生与技术的价值
- EJB,J2EE的核心,如何看待? .
- 如何看待自己的第一份工作
- 你是如何看待技术的
- 10月20日云栖精选夜读:揭秘云栖大会VR直播云服务解决方案的技术亮点和核心能力
- Intent跳转系统界面
- RasiePrivileges提升权限
- Halting process: ("Worker died")
- BGP——4字节AS号
- 如何看待自学3天的阿法元100:0完爆阿法狗?
- 依赖注入框架Autofac的简单使用
- 第十章
- Docker实战-编写Dockerfile
- 侧滑+底部导航+图片滑动
- Java源码之Object
- 从零开始成为优秀交互设计师应该怎么做(下)
- mysql分组查询 查出最新的数据
- Angular計算/