MIT的《深度学习》精读（7）

来源：互联网发布：阿里云服务器亚马逊编辑：程序博客网时间：2024/05/18 03:40

Many of the early successes of AI took place in relatively sterile and formal environments and did not require computers to have much knowledge about the world. For example, IBM’s Deep Blue chess-playing system defeated world champion Garry Kasparov in 1997 (Hsu, 2002). Chess is of course a very simple world, containing only sixty-four locations and thirty-two pieces that can move in only rigidly circumscribed ways. Devising a successful chess strategy is a
tremendous accomplishment, but the challenge is not due to the difficulty of describing the set of chess pieces and allowable moves to the computer. Chess can be completely described by a very brief list of completely formal rules, easily
provided ahead of time by the programmer.

许多早期AI成功的案例都是发生简单纯洁和正规化的环境里，并且不需要计算机对现实世界有很多知识的了解。例如在1997年(Hsu, 2002)IBM的深蓝国际象棋系统就打败世界冠军Garry Kasparov。国际象棋当然是一个比较简单、纯洁的世界，它仅包含64个可移动的位置，以及32个棋子，并且有严格的规则进行限制。尽管发明这个国际象棋的对战策略获得了巨大的成功，但是它的挑战成功的不是计算机难拟描述的棋子移动的问题，因为国际象棋可以通过一套规则列表就很容易让计算机进行工作，特别方便程序开发人员提前地写好这些规则。

在这一段里，提到了IBM深蓝，它是什么呢？请看如下：

人与计算机的首次对抗是在 1963 年。国际象棋大师兼教练大卫·布龙斯坦怀疑计算机的创造性能力，同意用自己的智慧与计算机较量。下棋的时候他有一个非常不利的条件：让一个后。但当对局进行到一半时，计算机就把布龙斯坦的一半兵力都吃掉了。这时，布龙斯坦要求再下一局，但这次却不再让子了！

1996年2月10日，超级电脑深蓝首次挑战西洋棋世界冠军卡斯帕罗夫，但以2-4落败。比赛在2月17日结束。其後研究小组把深蓝加以改良

1997 年 5 月 11 日，在人与计算机之间挑战赛的历史上可以说是历史性的一天。计算机在正常时限的比赛中首次击败了等级分排名世界第一的棋手。加里·卡斯帕罗夫以 2.5:3.5 （1胜2负3平）输给 IBM 的计算机程序 “深蓝”。机器的胜利标志着国际象棋历史的新时代。

深蓝是并行计算的电脑系统，建基于RS/6000SP，另加上480颗特别制造的VLSI象棋芯片。下棋程式以C语言写成，运行AIX 操作系统。1997年版本的深蓝运算速度为每秒2亿步棋，是其1996年版本的2倍。1997年 6月，深蓝在世界超级电脑中排名第259位，计算能力为每秒113.8亿次浮点运算。

1997年的深蓝可搜寻及估计随后的12步棋，而一名人类象棋好手大约可估计随后的10步棋。每增加1步棋的搜寻能力约等于增加下棋强度约80 ELO分。

研究人员和人工智能公司「DeepMind」（已经被 Google 收购）宣布了一个重大突破：在上年 10 月份，由 DeepMind 公司设计的计算机系统「AlphaGo」以 5 比 0 的成绩击败了欧洲围棋冠军。这场胜利在上周被刊登在《自然》杂志（Nature）上。

那么这究竟意味着什么呢？随着时间的推进，计算机在棋类游戏上的表现已经越来越精湛了。例如在 1997 年的「黑暗时代」，IBM 的「深蓝」（Deep Blue）计算机便曾经击败当时的世界象棋冠军加里 · 卡斯帕罗夫（Garry Kasparov）。和使用 6 类棋子的国际象棋相比，围棋所使用的只是黑白两只。那么为什么将 AlphaGo 在围棋上的胜利视为重大突破呢？原因非常简单：围棋所具备的可能性甚至比整个宇宙的原子数量还多，自然要比国际象棋所具备的可能性要多得多。

「深蓝」这类棋牌类程序的运行机制是为所有的可能性构建「搜索树」，但想要为围棋构建「搜索树」绝非一件容易的事情，其计算时间可能长达数百万年，甚至是数数十亿年之久。DeepMind 公司的做法是将「搜索树」（由 Google 公司强大的云计算能力支撑）和深层神经系统结合在一起。和和人类的大脑一样，这种模拟神经元的设计可以通过例子和经验作出反应，因此程序中不同层级之间的连接将在极大程度上得到强化。

AlphaGo 首先研究了围棋比赛中的 3,000 万种可能性，进而从现实的棋局中汲取信息。随后，AlphaGo 会通过 50 台计算机和自己进行博弈。配备有强化学习技术的 AlphaGo 在每一次迭代中都会得到优化。实际上，这项技术是 DeepMind 公司在不久前的实验中开发出来的。在这次实验中，DeepMind 公司的类神经网络通过观看电脑游戏的玩家回放，自学成为了一位熟练的游戏玩家。整个过程完全不涉及任何的编程工作。

AlphaGo 最让人觉得震撼的一点是：不论是程序本身还是程序的开发者都不能解释它所采取的行动。AlphaGo 能够在许多困难的游戏中展示出专业水准，它所展现的能力和我们所谓的「直觉」非常相近——在无意识推理的情况下汲取知识。截至目前为止，我们一直认为直觉是由人类专属的一种特权。牛顿（Newton）在《自然哲学的数学原理》第二版中曾表示自己从来不作任何的假设。「我从不作任何假设。」他写道，「但我已然知晓。」

如果 AlphaGo 真的可以证明机器也有具备直觉的可能，我们在人工智能技术上的发展将会步入一个全新的阶段。我们目前尚不清楚直觉的运行机制，但我们总是假定直觉只是一个属于人类范畴的名词。由于牛顿是一位天才，因此我们倾向于相信他的说法，正如我们总是倾向于相信一位察觉出孩子异样的母亲，又或者相信某人能够察觉出说谎的人。

重点在于直觉也有可能出错。根据我们的日常经验，直觉在很多时候往往并不正确，因此我们总会要求人们用证据和逻辑推理来佐证他们的直觉。但后面两种元素缺失的时候，直觉的说服力就会大打折扣。在当下阶段，过度关注计算机是否拥有直觉根本毫无必要，AlphaGo 是否能够解释自己所采取的行动也并非一个具有现实意义的问题。然而，当 DeepMind 的联合创始人德米斯 · 哈撒比斯博士（Dr Demis Hassabis）实现了他的愿景的时候，这个问题将会被提升至一个全新的高度。

「就效果而言，棋牌类游戏确实是开发和测试人工智能技术的一个理想平台。」哈撒比斯在上周发布的一篇博文中写道，「但最终我们还是希望使用这些技术来解决困扰世界已久的一些重要问题。这些技术无疑是具有通用性的，我们的目标是让它们帮助人类解决社会上最为紧迫、严峻的问题，例如气候建模和病毒分析等等。」

另一方面，哈撒比斯认为人工智能技术的开发者需要肩负起一定的社会责任。他一直呼吁人们开展一场以「道德在人工智能技术的开发工作中应扮演怎样的角色？」为主题的辩论。在去年 9 月份所举行的一个活动上，哈撒比斯透露称 Google 公司将会在内部设置一个道德委员会，以便对自己的所作所为进行监督。这个消息引起了与会人员的欢呼。

和领域中的其他人一样，哈撒比斯认为人工智能技术非常强大，因此在长期确实有引发严重道德问题的可能。更有甚者，这项技术甚至还可能威胁到人类的存在。但至少就目前看来，DeepMind 公司所取得的进展非常喜人。

MIT的《深度学习》精读（7）

1. TensorFlow入门基本教程

http://edu.csdn.net/course/detail/4369

2. C++标准模板库从入门到精通

http://edu.csdn.net/course/detail/3324

3.跟老菜鸟学C++

4. 跟老菜鸟学python

5. 在VC2015里学会使用tinyxml库

6. 在Windows下SVN的版本管理与实战

http://edu.csdn.net/course/detail/2579

7.Visual Studio 2015开发C++程序的基本使用

http://edu.csdn.net/course/detail/2570

8.在VC2015里使用protobuf协议

9.在VC2015里学会使用MySQL数据库