人工智能的冬天【杨强】

来源:互联网 发布:网络计划图软件 编辑:程序博客网 时间:2024/05/02 07:47



杨强(香港科技大学计算机系主任,华为诺亚方舟实验室主任):人工智能的冬天




在2015年的冬季达沃斯会议上,一个著名的中国企业家在中国之夜的聚会上正好坐在我对面。 他早上的时候就坐在我们有关人工智能演讲的会场里。看来, 他仍是意犹未尽,因为他问我问题的时候,眼睛好像在放着光:“我们离人工智能到底有多远?计算机究竟会不会做梦呢?”

的确,计算机有没有智能和情感, 会不会做梦,能不能有一天与人类作对? 这些貌似科幻的问题在达沃斯这个企业家和政治家们的讲坛上,也成了今年达沃斯会议的一个非正式主题。 今天,我们打开报纸,刷下微信朋友圈,会发现突然之间,有关人工智能的议题已然成为各类媒体的新宠。人工智能的一些业内人士也在热切的展望未来,把人工智能的火焰烧得更旺,“心潮逐浪高” 。在前些日子的百度BigTalk大会上,人工智能的大咖吴恩达教授更说道: “结合大数据,新的人工智能的算法越来越好, 我们可以第一次在未来人工智能虚拟圈里完成整个循环。”

实际上,人类对人工智能感兴趣并不是今天才有的。 早在1980年代, 我在美国留学的时候, 曾经问过一个刚毕业,将要去做教授的同学:计算机这么多的领域,我应该选择哪个方向做研究呢?“人工智能,人工智能!”他兴奋的说,“我们今天有各种各样的科学实验手段,带我们到太空去研究宇宙,带我们到深海去探测地球。要探索物质我们有强子对撞机,要了解人类的生命我们有生物学。唯一做不到的,就是把我们自己的脑袋打开,看一看里面到底是怎么工作的,并让机器具有人的智能究!”听他说着,我也激动起来。对啊, 在物理学已经有了牛顿和爱因斯坦,在生物学里我们也有了发现DNA的沃森和克里克, 但对如何让机器人思维,学习知识的的这些问题,我们却真的刚刚开始涉及。如果能做一个这方面的先驱,那是这一生当中多么爽的一件事啊!我的博士导师的后来话和这位学长的话一样令人振奋:“我们计算机科学家需要了解什么,不用去等别人发明很多工具以后再开始。 我们的办法, 就是自己把这些工具做出来!”

一个历史事件就发生在1956年。在那个遥远而炎热的夏天,一小群MIT等学校的的年轻人聚集在美国麻州的达特茅斯学院,开始畅想人工智能的未来。 可以想像他们一边摇着长发听着披头士的歌,一边畅想着人工智能这回事儿,都觉得三个月应该足可以搞定人工智能这回事儿了。他们发扬了MIT说干就干的精神,现场就把人工智能分成了几大分支。有一群人就说,机器人的智能一定要解决视觉的问题,所以“计算机视觉”这个领域就由此产生了。另外几个人说,智能的计算机需要理解人的语言;因此,“自然语言处理”这个方向诞生了。还有一群人说,智能的计算机需要有一个强大推理的能力,因为逻辑思维很重要。因此他们设计了一个新的学科“智能规划”,研究人在面临的复杂问题的时候如何能够找到一个巧妙的方法来解决它。比如,计算机可以下象棋或者打桥牌吗?

当时大家信心满满,认为人工智能应该在不久的将来就会实现。比方说,在1962年的时候卡内基.梅陇大学(CMU)的西蒙博士,经济学的诺贝尔奖获得者,就曾断言:“二十年内,计算机将完成人能做到的一切工作。”在1970年左右,MIT的大师Minsky博士说:“在三到八年的时间里,我们将有一台具有人类平均智能的计算机。”但不幸的是,虽然他们都聪明异常,他们都错了:因为直到今天,六十年后,我们也没有做出一台真正具有人类平均智能的计算机。这是为什么呢?

人工智能的成功, 和其他学科一样,是需要一些先决条件的。 第一个条件就是高效和廉价的计算能力。 这个条件在少数人才能有一个小的可怜的计算机的1960,1970年代,是没有可能实现的。 而这个条件后来被一个公司率先实现,这个公司就是IBM。IBM的决策者们联合CMU大学的研究人员, 开始意识到自己掌握着人工智能的第一把钥匙:高性能的计算机处理器。他们需要选择的是一个非常瞩目的领域,而且通过被人们普遍认为是只有智慧的人类才独有的某个领域来展现。这个被选中的领域就是国际象棋!

在下象棋这个领域里,当时的世界冠军是苏联的Kasparov。当他接到IBM深蓝团队的邀请时,他的第一反应是嗤之以鼻。但是计算机凭着大量的棋谱数据和计算机在所有可能的棋局空间飞速探索的功能,可以看到人类所不能看到的很远的结局,从而给出正确的决策。当Kasparov发现情况不对时,已经晚了! 在Kasparov输给计算机之后, 有一个报纸的漫画这样写到:Kasparov只有一个办法,可以一步就可以击败深蓝:就是把电源线拔掉。


这样,具有大规模超强计算能力IBM深蓝计算机首次击败一个血肉之躯的世界大师。这里的一个诀窍是,是IBM聚集了大量的二流国际象棋大师,借以把所有可能遇到的棋局进行分析, 再把具有这样分析知识的计算机来和这位世界冠军比赛。 结果发现,也许一个一流的大师可以战胜十个二流的大师, 但他缺下不过200个二流大师的总和。 高性能计算就是汇集这200个大师智慧的中枢。

继象棋大赛之后,人工智能的“成果”一个接一个低出现:手写识别,人脸识别,自动推理,自动规划,自动控制机器人。 在一片媒体和工业,政府的掌声当中,计算机科学家和其他的人们一样,被胜利冲昏了头脑,天真地认为,人工智能的成功真的离今天不远了。 日本政府也收到人工智能科学家的鼓动,举全国之力,发展“第五代计算机。”可以说, 人们对人工智能的高度期待,正是像我们现在正在经历的那样狂热到非理性, 只是那一次是发生在30多年前。

人工智能既然如此强大,工业届的人们开始设想工业 n.0 的时代。在1980年代的人们大都认为,计算机再加上“专家”可以形成无比强大的所谓“专家系统,”直接取代人类。 通过知识工程,人工智能可以把这些专家们头脑里的智慧放到计算机里,并通过逻辑推理加以无限扩展。这样,那些需要大量时间训练的职业, 如医生,律师,工程师等都可以由这些专家系统来担任。 我有一个做文科的同学,她的毕业论文题目就是:在一个以专家系统为基础的社会里,人们可能也不需要去工作了, 那么,人类应该怎样打发时间呢? 会不会我们每天都可以去打网球休假? 也有一些人开始担心: 如果计算机赋予了人工智能, 会不会把人们的工作偷走? 人类会不会变懒? 总统会不会是个机器人? 

但是很快,非理性的狂欢终于付出了它应付的代价。工业届的专家系统的应用者也是要有KPI的。 人们很快就发现,虽然手里有非常强大的专家系统,但它毕竟只是一个外壳儿。专家系统所需要的知识就像天上的云,看得见但是抓不住。是的, 专家们都很牛,知道如何解决复杂的问题,但他们却不知道自己为什么牛,是如何解决问题的。 不信的话大家也可以试一试:你看到一幅你喜欢的油画你会很快乐,但却不能说清楚究竟你喜欢这些油画的什么特点,至少不能一条一条完整地写下来。所以,专家系统就像没有汽油的宝马,虽然华贵,但是没法用。 

记得当时“压载骆驼身上的最后一根稻草”来自美国军方在1980年代美国和伊朗一次海湾战争。有一天,一个装有专家系统的导弹驱逐舰错把一架波音747飞识别成F14战斗机,进而自行决定越过舰长发射两枚导弹。 这造成了三百多平民死亡的惨剧。美国各家媒体立马对这个时间的罪魁祸首进行了调查,专家系统也被蒙上了污点。这个事儿直到今天都被列为专家系统严重失败的一个例子。

此后的形势便江河日下。 到了1980年代末,人工智能和专家系统所产生出来的效益远远不如当初人们所预期的那样好,就像一个远未达到评论员预期的股票,被产业界所卖空。人工智能这个领域也变成了学生们远离的对象。当时学人工智能的学生,毕业以后其本上都找不到工作,就好像在街上遇到熟人都不太好意思去打招呼。人工智能在1990年代的初期也就陷入了一个历史的低点。这个低点被人们成为“人工智能的冬天。”

从1980年到2010年的这二十年间,人工智能仍然处于早春的峭寒。 这个时候最火的学科是网络和数据库, 而最好的学生也一般不愿意进入到人工智能的领域来,因为他们毕业以后很可能是找不到工作的。但是恰恰在这段安静的时间,有些人在悄悄的辛勤耕耘探索。他们并没有被上一次的风暴所打击,而是在有限的资源条件下,分析以往的错误,寻找新的路径。

这里我要开始说人工智能成功的第二个条件。这个条件直到1995年以后才渐渐地得以实现。这个条件就是大数据。

在下一个十年,周边的条件也在悄悄地发生变化。 一个是互联网的快速普及,使得大家更加容易地进行沟通,能够把不同的数据汇聚在一起,形成规模效应。 另一个是智能终端的飞速普及,使得我们每个人都可以带着一个数码相机和录音器。这两种技术的普及使得各种不同的数据像寒冰化解的春水,流入大数据的海洋。


在人工智能迈入五十不惑之年的时候,这些潜移默化的革新终于带来了新的气象:IBM的Watson团队利用网上的知识库数据和大量的问答题语料,做出了IBM Watson 系统,一举击败电视问答比赛的冠军;Siri强大的问答功能,正在逐步取代iPhone的键盘做为信息输入的端口;Google大脑的图像识别程序利用深度学习正在赶超人的图像识别能力。

语音识别和自然语言处理的技术也日新月异。这些种种迹象为人工智能带来了第二春: 各大公司争相建立人工智能实验室,展示他们最新的研究成果。文科生和未来学的粉丝们也像冬眠后的小鸟,开始了春天里的歌唱。也有人开始畅想机器人何时能取代人类,还有人担心人工智能会否与人类做对,让人类变傻? 人类也因此完成了又一次循环。当未来学家大行其道的时候,我们知道,人工智能的又一个夏天来到了。

但是,问题又来了:夏天来了, 冬天还会远吗?

最近看的一本书,说“未来”虽然不确定,但有两件事我们事知道的: 第一是“未来”和现在肯定不一样; 第二就是“未来”肯定是从现在开始的。 

我们如果真的是处在人工智能的夏天,就应该找一个树荫,冷静地来分析一下:现在人工智能所取得的成就还都集中在人和计算机的接口:语音,视觉,文字。然而,人类智慧的最高表现却是抽象的推理和联想,可以让我们从一个事件关联到另外一个事件,从一种知识迁移到另外一种知识。以上的这些所谓的“强人工智能”的能力,是不是由众多的单一方向的“弱人工智能”的大量叠加可以得到的呢?我们尚不得而知。 如今,计算机的这种跨领域的学习能力还远远没有得到实现,甚至连知识殿堂的入口都不知道在哪里。纠其主因,是我们至今的计算能力还不够强大,在这些领域还是无法得到全面反应人类思维的大数据。我们的学习算法还需要无数的大数据来提供人工智能机器运转的“燃料。” 而这些大数据的准备工作还是需要昂贵的人工来提供, 并不能形成滚雪球式的规模效应。这些缺陷很可能阻碍我们得到真正智能的工具,使得吴恩达博士所说的“虚拟闭环”有很大的缺口。

这些缺口的致命之处很可像我们在30年前的那个冬天面对没有汽油的宝马所带来的尴尬:只是今天在我们面前的是一辆漂亮的特斯拉,但却怎么也找不到加电站!

我们会不会在人工智能的集体狂欢中忽略了最本质得东西, 以至于不小心穿越到30多年前的那个人工智能的冬天?  


0 0
原创粉丝点击