Michael I. Jordan:我们并非处于人工智能的大爆炸时代

来源:互联网 发布:新奔腾预算软件 编辑:程序博客网 时间:2024/05/22 03:52


编者按:人工智能被炒得沸沸扬扬,凛冬过后,属于AI的神奇大爆炸时代果真到来了吗?事实上,将人工智能和机器学习的发展简单理解为一个忽如其来的神迹是片面、浅显的,我们需要对人工智能有更加清楚准确的认识,才能更好地利用技术。


本文中,加州大学伯克利分校教授、美国三院院士Michael I. Jordan将以独特且冷静的视角带你窥探人工智能领域的真实世界。本文转载自公众号“混沌大学”(内容有部分删减)。




目前,人们讲到人工智能和机器学习,可能还是觉得它很复杂。事实上,关于这个话题,有很多东西还停留在概念性、战略性的阶段。当然,也有一些投入实际应用的技术,但这背后的理论是非常基础和简单的。


人工智能与机器学习,其实还远远不是一门基础扎实的工程学科,它并不能为现在用数据分析问题提供强大且可拓展的解决方案。因此,我们并不能将人工智能与机器学习的发展简单理解为一个神迹,如同高楼非一夜而起,它是必须要经历长时间的发展的。


大家首先要意识到,在这一领域,我们仍处于非常初级的阶段。很多事情我们还不了解,现今的我们并非处于一个人工智能的神奇大爆炸时代。可以说,我们有可能要花上百年的时间,这个高楼大厦才能真正地建立起来。




准确认知人工智能的现在与未来


目前的智能系统还无法做到对场景的常识理解,我们也不太可能看到所谓的“超级人类AI”。抛弃那些外界的宣传,我们需要实际且准确地理解人工智能。我们来讲,目前的人工智能有哪些可能性,以及哪些技术还没有实现的可能。


计算机视觉

可能:在可视场景中标记对象

目前尚无可能:对视觉场景的常识理解


比如,一个会议室的摄像机,把它连接到电脑上后,让它区分哪些是人脸。在目前,人工智能也许可以标记对象,但却不能理解这个场景。作为人类,我知道这个会议室有很多人,出口在哪里,我要小心台阶不能掉下去。这是我的常识性理解,但计算机是做不到的。


语音识别

可能:多语种语音到文本和文本到语音的转换

目前尚无可能:对听觉场景的常识理解


我的声音可以通过话筒接到电脑中并转化为文本,转化为语音。但如上所述,电脑并不能对文本背后的常识进行理解。人们可以马上理解一个很复杂的句子来预测下一步行动,但计算机做不到。


自然语言处理

可能:最低限度的翻译和问答

目前尚无可能:语义理解、对话


自然语言中有很多东西,机器是做不到的。机器只能死记硬背,却没有办法真正地回答问题。当你和电脑交流的时候,它可以回答你“中国最大的城市是哪一个”,那是它通过“中国”、“城市”、“最大”这三个关键词,在百度搜索的答案。但如果你的问题是“中国不在河边的第二大城市是哪一个”,电脑给你的答案一定是对你一点用都没有的。因为在此之前可能从来没有人做过这个问题的相关数据,没有这个问题答案的数据列表。


但在未来的十年,上述被列为“尚无可能”的部分,将至少可实现基本形式。十年,就技术而言,是一个很长的时间窗口。事实上有一些技术已经开始出现,只是目前在比较原始初级的阶段而已。比如自驾车以及自驾式空中出租车,它们还是会出现的。尽管不会是超级智能,但肯定会越来越好。


但请注意,人工智能系统仍然是非常有限的智能系统。我相信,我的AI同事们也会赞同我的观点:我们不太可能看到和人有同等智力的灵活性与创造性的AI系统


首先,人类每时每刻都在以新的方式思考怎样用新的语言来表述,就像我现在讲的每一句话都是有创造性的,我在讲话中可以不断讲新的内容以及新的理念,使用隐喻、反讽等修辞。在现实中,AI系统还做不到。AI可以帮你做一些基础工作,比如帮你在网上订一张票,但是它无法和你谈人生。


此外,人类还非常善于做新的抽象推理。比如,“Blank从上海走到杭州只花了3个小时”。作为人类,你会做很多推理:Blank会移动,而且从上海走到杭州只花了三个小时,它的运动速度一定很快。那么,你会针对Blank问很多问题。但AI系统就做不到,它需要反复、重复用海量的数据才能得出一个答案。


最后,人非常擅长计划和规划。而AI系统只是擅于捕捉目前的数据,而不可能对未来做出一个长期的、有条不紊的规划。


很多人在讲“超级人类AI”,这类人一定没有在AI领域工作过,他们根本就不知道AI领域中存在的技术问题有多难。AI系统可以知道世界所有的城市、餐厅、电影院,然而它也只知道这些事实而已。所以,我不相信所谓的“超级人类AI”,也不相信AI会比人更聪明。


人们觉得AlphaGo很厉害,是因为觉得一般玩围棋的人就很聪明了,那能打败玩围棋的人肯定更聪明。这是有误解的。人知道怎么还贷款,上什么学校,怎么和同伴做智慧交流,这些事都是AlphaGo做不到的。其实,AlphaGo只是通过无数对棋盘的模拟,非常机械地、不断重复地复盘,十几亿、几百亿次地进行学习。这背后没有什么创造力,只是无数次的重复工作。


所谓的“智能”,是我们根据参数汇集起来的数据算法,它们只能复制、模仿、模拟人类的行动,而不是真正的智能。说到底,相比我们真实的世界,围棋的复杂程度要低很多,因为真实的世界充满不确定性。我觉得,有生之年不会出现这个奇点了。



传统机器人算法不能适应未来


既然“超级人类AI”还遥遥无期,那么什么才是值得大家担心的呢?和超人类智能系统正好相反的是,看似智能,实则不够智能的这些系统,却是值得我们警惕的。


很多媒体提到AI的时候,讲到的是视觉、语音的方面。但我们未来涉及到城市规划、推荐系统、医学诊断等,都不再是传统单一机器人的问题。这是完全不同类型的问题。


一个机器人的某一错误我们是可以控制的。比如,机器人走到舞台边缘,探测到下面将有一个高度落差,它会知道停下来。但如果是一系列问题呢?又或者,是很多机器人一起呢?


如果大楼发生火灾,这个机器人就不会知道该怎样逃出去。因为,这是一系列的决策,涉及到你从哪里转移到哪里,还需要和其他人的合作。比如,大家都从同一个逃生通道出逃,就会出现堵塞,那么,就要选择换其他的道路。在这种情况下,机器人是做不到的,这样的算法是非常难的。


如果你用过去传统的机器人研发算法去应用到城市规划建设等领域,就会出现很多无法解决的重大问题:


  • 大规模多重相关决策的错误控制


搜索引擎给你一个错误的推荐建议,如果没有人因此死亡,就不会出现什么大错漏。顶多你会觉得这个搜索引擎不好用,再换一个就完了。但假设这个推荐是医疗诊断意见呢?如果这个意见出现错误,那真的是会出人命的。而且,我们已经看到这件事情的发生了。


即便是在金融服务领域,一旦出现错误,也可能会引发市场的大动荡。交通也是如此,如果连公交走向都出现问题,就极有可能发生车辆碰撞,整个城市的交通陷入瘫痪。


因此,一旦扩大到这些领域,我们就不能再以传统应用到单一机器人的算法去做这种大规模的事情,必须要有新算法。但事实上,在这一点上,我们远未达到。目前,我们所沿用的思路都是比较传统或通用的,并没有意识到在这个层级上还需要做很多事情。


  • 如何在竞争环境中共享数据


很多公司手握数据,却不愿与人分享。假如,有一个黑客找出了新的办法来骗钱,他针对了某一家公司A。那么,A公司就会从这次欺诈当中学到新东西,可以未来避免同样的情况。但因为当初的攻击只针对了A公司,其他的公司并不知道,因此也就不知道如何改进自己的系统了。


表面上看,A公司只把这个技术掌握在自己手里,让其他人学不到,这好像有点自私。因为,他没有从整个行业的角度去考虑问题。如果这家公司把这个数据分享给所有人,整个行业就可以一起改善这个算法。但现在大家都不愿分享,其实一方面是技术原因,一方面也是法律的原因。


  • 大规模的云端互动


大家都在谈云计算,所有的东西都在云上,让人们感觉到非常便利。但这些智能设备,并不是云设备,而是端设备。事实上,我们未来将要接触的设备,都会是所谓的端设备,它们没有时间将数据上传到云中。如果你和机器人的每一次对话都要上传到云,就会导致速度跟不上。


比如,汽车做智能,“我在这里到底要不要转弯”这样的问题,是不可能每一次都实时和云进行交互的。因此,要把端设备和云连接起来,还要实时交互,这两者之间是存在极大挑战的,我们现在也不知道该怎么做。


  • 如何实现公平,保证品质、保持多元化


收集大量的数据并没有问题,但这些数据是可能产生偏差的。比如,你出于某种原因不喜欢某类人而没有把他们纳入你的样本,但以这样的样本去做预测其结果本身就是存在偏差和偏见的。


  • 稳健性和安全性问题


我们在报纸上经常讲到所谓的超级AI,发生了某种革命。但请记住我今天讲的话:很多技术还远远不能实现,很多问题还有待解决。比如,无人驾驶车怎样确保在所有气候条件下,在所有的路况前提上,每一台车都可以保证安全驾驶呢?这其实也是一个极大的挑战。甚至在今天,传统的单一机器人,也仍有很多问题没有解决。


还有失业浪潮。每一次工业革命,都有很多人会因此失去工作。但值得注意的是,过去的失业浪潮是花费三五十年完成的。但接下来,很多工作可能在5-10年内就会被完全取代,这是一个新的趋势,贫富差距也会随之进一步拉大。并且,人工智能可能会被居心叵测的人滥用。AI本身不存在邪恶与正义,主要还是看它被谁利用。比如,我们现在的网络安全就是一个很严重的问题。




人工智能的商业模式:创造市场


传统的推荐,都是针对个人。但这里的问题是,如果有一家很好的餐厅,它被推荐给很多人,那么大家都跑到这家餐厅去,就需要排长队,人们的体验就会很糟糕,反过来给差评和抱怨。


如此,整个系统就开始崩溃,形成恶性循环。你必须要去创造一个市场,而非一个简单的算法。比如,在APP上面,不仅仅是向客户推荐某一家餐厅。除了让客户看到自己附近有什么餐厅之外,你还要让餐厅看到自己今晚可以供应多少食材,我今天接了一场婚宴之后,还剩下多少个散客的位置。甚至,你可以了解一下旁边的竞争对手餐厅,他们有没有满座。如果旁边满座了,那么对我而言就是一个机会,我可以打折吸引更多的人流到的餐厅。


你必须结合客户和商户两端的需求,这不仅是一个应用的事情。现在很多公司已经着手在研究这方面的工作。当然,这个过程要充分考虑人们不同的喜好和需求,要掌握大量的数据。


你也许还想


● 媒体|迈克尔·乔丹:几百年内AI不会觉醒

● 对话沈向洋 | 在人工智能最好的时代,寻求可能性比超前顾虑更关键

● 科学匠人 | 四力合一,独立思考是研究的“秘密武器”


感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:msraai@microsoft.com。

微软小冰进驻微软研究院微信啦!快去主页和她聊聊天吧。

阅读全文
0 0
原创粉丝点击