北大“人工智能前沿与产业趋势”课程整理01

来源：互联网发布：淘宝开店免费的吗编辑：程序博客网时间：2024/06/08 04:42

第五讲：小米黄江吉-人工智能硬件的发展
第六讲：碳云王俊-DNA是生命数字化的过程，AI改变生命科学
第七讲：百度徐伟-AGI 2050年前实现可能性超50%
第八讲：华为李航-自然语言处理的现象与挑战
第九讲：滴滴叶杰平-深度学习在交通领域应用潜力巨大

第五讲：小米黄江吉-人工智能硬件的发展

人工智能三大前提：产品+大数据+机器学习；

以小米为例，从手机、电商、家庭路由器、电视云平台、互娱市场、生态链都不断产生数据。这些数据都非常原始，需要清洗。之后是数据挖掘，数据智能。

一定要把技术做到产品里面，做到服务里面，它的价值才可以最大化地发挥出来。

第六讲：碳云王俊-DNA是生命数字化的过程，AI改变生命科学

碳云智能基于了三个基本假设：生命是可以数字化的；生命是可以被计算的；生命也是可以被网络化的。

碳基：碳基的程序是迄今为止最高效存储介质，全世界所有的信息可以存在一公斤的DNA里面，它可以储存上亿年，轻轻松松百万年。我们现在没有哪一种计算机的存储介质可以放一百万年，一个光盘放几十年可能就不行了。DNA是迄今为止最高效的一个存储介质。你要想弄懂生命这个程序，应该做的第一件事情就是把这个程序读出来。

中国有一个很出名的计划叫“百分之一计划”，中国参与了人类基因的计划，测定了其中的1%。这个计划是全球三千多名科学家把一个人的基因图谱序列，31个字母读出来。现在一台机器可以在一天内轻松读取一个人的基因图谱，一千美金。这个过程是在十五年之内完成。十五年的时间，从原来一亿美金测一个人的全部基因，到现在的一千美金。除了读人的基因之外，也可以读所有动植物的基因和图谱序列。

每个人的基因都读出来到底有什么用？
1.第一个服务就是出生缺陷。这个世界上有差不多5%到6%的出生缺陷的孩子，出生缺陷的孩子里面有相当大一部分都是跟基因有关。

2.第二个服务就是传染源检测。比如发烧，拉肚子，不知道到底是哪个病毒还是微生物感染，这件事情应该做的是把血液或者粪便里面的DNA提取出来做测序，做完以后发现人体内有没有哪一种微生物感染，或者哪种病毒感染。

3.第二个服务就是个性化用药。因为每个药的开发都是针对于某种基因，某一个代谢通路。肿瘤的发生是跟基因和代谢通路有关，我看我哪个地方的基因坏了，有没有这个药，对应性的来找一找，事实上是这么一个应用的过程。

DNA其实现在已经发展到可以简单拷贝，它是一个数字载体，就像计算机一样，可以简单的被拷贝，克隆就是这样，把一个完整的DNA克隆到另外一个上面。比如说基因编辑，这段DNA31个字母，我想改哪个改哪个，我就把那个字母给它改一改。还有一个进行合成，我计算机里面写一段代码，那边就从试管里合成出来。

测一下基因就知道我得什么病了，这听起来好像很简单的一件事，但生命的复杂程度远远大于这个，我测完了以后我是有了一个起点，但是我最终会怎么样我不知道，因为生命的过程当中有很多的起起伏伏。我怎么才能了解生命本身，只有一个办法就是做一个硅基世界的人工智能的我，做一个数字化的我，能模拟碳基世界的我。在计算机里面有个我，有个王俊，现实生活里面有个王俊，那个王俊不断在学习我这个王俊。如果我所有的特性全部数字化，全部给它，我的每一个输出全部是我最后的训练结果，我能动性的把那个我的数字生命（硅基世界的那个我）变得越来越像碳基世界的这个我，这是碳云要做的一件事。

华大做的事情是读基因，把基因越读越便宜。碳云智能想做的事情就是懂生命。基因事业本身需要做很多东西，首先是建立在碳基里面的一个学习系统，这个学习系统有很多输入，也有很多输出，很多东西要把它数字化。那我数字化什么东西呢，先从DNA的中心法则做起，我的基因序列要知道，我的基因的甲基化要知道，我的RNA要知道，我的蛋白质要知道，我的代谢物要知道，我身体里面，我抽个血，验个尿，粪便里面的各种各样的分子生物学信息全部都知道。一听到这个就头大，好多好多的东西。如果就做个基因还相对简单，就测个序。现在一想这么多数据，怎么办，很多的技术有没有，存不存在，所以碳云在成立之后去做了很多事。做了大规模的收购。

数字生命的程序里，没有一个人的程序是完美的，所有的人都有缺陷，但每一个生命程序都是特别的。你所需要做的事情是把它数字化，找到你最特别的地方，然后再找到你不完美的地方，用你特别的地方去帮助别人的不完美，这就是那个数字生命网络能够达成的最好的东西，而这个东西现在是可以做的。加入这个网络的人越多，这个模型越精准，你能够找到你的特别和你不完美的地方的可能性越大。

生命本身是个旅程，基因是起点，不是终点，在这个过程中，你是你自己的选择，根据你的数字化生命模型做出最好的选择。我希望每个人都能够理性的做越来越好的选择，让身体更健康。

第七讲：百度徐伟-AGI 2050年前实现可能性超50%

什么是通用人工智能（AGI）?

具备执行人类所进行的各种智能任务的能力：感知、决策、推理、规划、沟通。其核心是学习能力：渐进学习、自主学习、交互式学习。

强人工智能具有很强的智能，但并不具有意识？其实只要达到人的智能就可以了，有没有意识不重要。

人类意识究竟是一种对智力的超越，还是其实是智力范畴内的一个东西？其实很多时候我们做出了决策，但自己并不清楚是如何决策的。这似乎是一种非理性的决策，但从更高的层面来看，我们所有的决策都受到我们的历史环境、经济条件等因素的影响。其实你的大脑里面还是有一个很大的函数的，一个F函数，你的历史、环境、人际关系、收入等等综合影响着你的决策。你拍脑袋的决定实际上并不是拍脑袋产生的。之前有一个研究，通过对一个人在社交媒体上点赞的分析，就能得到他的某种情绪模型。然后根据这个模型，可以对这个人对一些言论的反馈做出预测。预测准确度比他身边的人还高。所以说，我们大脑的一些功能，比如人脸识别，可能是笼罩在我们大脑里的极其复杂的运算，我们暂时无法解释而已。但这并不表示它不是运算的结果，而是突然出现的某种神器的东西。比如让人工智能下围棋，最早认为人工智能不可能具有人类下围棋时的那种大局观。但是现在我们看到，人工智能的大局观比人类还好。有时候局面太复杂，人脑也算不出来了。但不管怎么说，这还是一种运算，不管是基于贝叶斯还是基于技术经验。当然这种运算的复杂度很高，人类现在还无法用一个函数把它描述得很清楚。当机器拥有了大量的数据、大量的运算能力后，有可能做得比我们更好，而且有可能每次都很好。人类的灵感不是时时产生的，神来之笔无法每次需要时都产生。当机器智能达到很高的水平之后，这些事情会更大概率的出现。所以说它背后其实还是一种运算。它可能是我们大脑里面一个很神奇的函数，它的最大值是我们的某种价值观，比如个人的幸福感等等。一个人能根据环境、条件等等综合做出一个选择，背后其实是一个很理性的过程。以前我们无法界定什么是幸福感，现在从脑科学的角度来看，它可能是你大脑里某个机构发出了一个信号，多巴胺分泌了一下，然后你就感到了幸福。它并没有那么多神奇的东西，最后还是大脑运算之后激活了一个地方，然后你就幸福了。

机器学习大部分是基于归纳的，人类有演绎和推理的能力，在推理方面，机器现在有没有什么进展？

推理目前还是一个不太成熟的方向，如果这方面的研究越来越好的话，人类能做的事情可能就越来越少了。

有没有一个明确的定义，可以定义通用人工智能达到了人类的水平？

通用人工智能就跟人一样，如果不单独加任何跟开车有关的代码，直接让它学开车，它如果学的速度跟人一样快，或者说直接让它去学数学，它也学的和人一样快，这样就是达到了人类的智能水平。

有没有一种理论能够证明，深度学习模型比其他方法好，还是说这是一种实践的结果？

最重要的还是来自于实践。在实践中取得了这么好的效果后，一些研究者开始尝试从理论上做出解释，它的效果为什么会这么好。最近可能有一些这样的研究，就是在一些特定的模型结构下，在一些假设的状况下，来证明它能找到的解总是和神经网络的全局最优解接近。不过这些研究还是很难解释深度学习最近取得的成功。所以说目前还没有非常完美的理论解释。

第八讲：华为李航-自然语言处理的现象与挑战

我们所说的自然语言理解，学术界有两个定义，一个是基于表示的，你说的话能被计算机映射到其内部的表示，我们认为计算机理解了；另外一个是基于行为的，计算机做出了你指示的行为，后者的定义往往是大家更喜欢采用的。

为什么自然语言理解是非常困难的一件事？

1.语言是不完全有规律的，规律和意外并存，会出现功能冗余，逻辑不一致等情况，如果不遵循规范，交流非常困难，而规范是非常错综复杂的。

2.语言是可以组合的，语言是能把词形成句子，甚至是递归去组织句子，构建出非常复杂的表达。

3.语言的发明创造本身和比喻密切相关，语言的本质是开放的集合，人们可以去发明创造新的表达，一旦形成了以后大家会经常使用，产生新的语义，这是完全开放无穷无尽的。如网络中将“潜水”和沉默不语进行联系，使“潜水”一词出现了新的语义。

4.语言要和世界知识相联系，了解相关的概念和事实。

5.语言的使用是在一个环境里，语言是一种互动，是一个交流的工具。语言终极的理解要结合上下文，结合语境。

自然语言处理最核心的想法是基于数据驱动，用机器学习实现，问题可以分为五大数学模型：

分类：将标签分配给字符串，文本分类和情绪识别；
匹配：匹配两个字符串，搜索、问答、（产生式的）单轮对话；
翻译：将一个字符串转换为另外一个，机器翻译、语音识别、手写识别；
结构化预测：将字符串映射到结构，专名识别、词性标注、文本句法分析、文本语义分析；
马尔可夫决策过程：决定下一个状态给予以前的状态和行动，多轮对话；
自然语言处理，考虑是不是实用，一定程度上是看技术的上界和性能下界的关系。不同的用户和场景对性能的要求不同，比如互联网搜索准确度不是极高，但用户都认为很好。

当技术上界遇到用户需求下界，就可以实用化，未来自然语言处理技术常见的应用有以下这些：

语音识别：已经比较实用；
单轮对话：这个方法往往把它变成一个分类问题，或者结构预测的问题；
多轮对话：还很不成熟，特定环境下才能做好；
单轮问答：已经开始实用化（不知道的时候说不知道，反而很有用）；
机器翻译：不断提高接近人，但不能完全替代人，本质上和人的做法不同；

趋势

趋势一：语音识别、机器翻译已经起飞了，大家都在用，真正对话的翻译还有很长的路要走，说不定能做到很好；
自动语音识别被广泛应用于语言输入

书面语言翻译将在实践中得到更广泛的应用
口语翻译将逐步得到利用和改进
还有待解决的问题，例如长尾挑战（专有名词，语音识别遇到中英文夹杂）
原因：深度学习往往基于统计，解决的是多次重复的东西。长尾现象是一个问题，完全彻底的解决还是比较困难，这是机器学习本质上的局限。

趋势二：单轮问答会越来越实用化，特别是场景驱动的。

趋势三：多轮对话需要更多的研究。
多轮对话本质上是大量学习，人做多轮对话不需要重复很多，是天生能力、这种能否用现有技术模拟和近似，还不是很清楚。多轮对话因为数据不够，不容易解决，这也是未来要研究的方向。多轮对话即使是任务特定，也比较困难，聊天机器人更难了。马尔科夫决策过程都用不上。聊天机器人每一轮都是单轮对话，做不成很合理的多轮对话。多轮对话，如果有任务驱动和有更多数据，可能会越来越好。

总结：

1.自然语言理解很难。
2.自然语言处理现在用数据驱动的办法去做五个最基本的问题，可以分到分类、匹配、翻译、结构预测和马尔克夫决策过程这样一些具体问题上。
3.有了数据我们可以跑这种AI的闭环，不断提高我们系统的性能和算法的能力。
4.深度学习在五个大的任务里面的前四个，都能做的很好，特别是机器翻译，基于任务驱动的单轮对话，应该也能做的越来越好。但是还有很多问题，比如多轮对话需要去研究和解决。

第九讲：滴滴叶杰平-深度学习在交通领域应用潜力巨大

滴滴是12年成立的，先是有出租车，后来到14年有专车，然后15年之后有了快车顺风车公交等等。现在每天订单超过2000万单，所以你要是做人工智能做机器学习，那这个样本量就一天是2000万，每天处理的数据是2000TB，每天的路径规划是90亿。现在这个平台上有4亿用户。

核心项目

ETA：意思是从A到B大约需要多长时间，这是滴滴非常核心的一个功能。例如，用户想6点40到达教室，那么多久能打到车，司机接你大概几分钟，如果有预估，那么用户能够更精准地去做决策。

智能分单：就是乘客搜索司机。这个过程用时间来预估，越近越好，精准预测三公里之内哪个司机离你最近。第二是司机接到你，然后到目的地大概预估的价钱。预估的价钱本质上是由两个原因决定，即距离和时间。从起点到终点应该怎么走，这是一个非常复杂的问题，每秒要有成千上万个计算，还有A到B的时间大概是多久。结合时间距离以及公式算出预估价，准确度非常重要，准确度对用户也非常关键。滴滴平台上隔5秒钟后再去打车，情况可能完全不一样，几秒钟状态就可能发生很大变化，所以说智能分单的挑战性很大，需要做实时匹配。

Q&A

1.滴滴做的模型上线的时候，对性能的追求和运算质量如何平衡？
我们希望在训练中建立最好的模型，精度越高越好，基础平台搭建了GPU集群，增加计算量，减少计算时间。线上有压力，我们希望模型不是特别复杂，只能挑一个。我们现在在做的，也是业界在研究的一个方向是：模型已经确定好，如何压缩（当计算量大量减少时，尽可能精确）。这是我们探索的一个方向。这个问题部分代表了学术和产业的差异。我们学术上只做第一步，做最好的模型。第二点我们往往忽略，放到线上我们不可能用大量的资源进行计算，落地时，第二点比第一点还要重要，要考虑效率和付出成本。

2.未来五年，出行大交通，深度学习会怎样影响产业，哪些技术带来巨大贡献，机遇和挑战有哪些？
滴滴在智慧交通中和政府合作，政府共享了公交车，摄像头等数据。最终希望各方把数据打通整合起来，才能更加完整刻画交通全貌，做更多决策。这是第一点。第二点是智慧交通，如何把数据整合起来之后解决实际的交通问题，城市的规划建设。滴滴已经在济南实验中看到巨大潜力，更大效率是多方配合合作，更精准反应路况。第三点是智能交通，比如说物联网：车是相连的，车和路上设备也是相连的，做更精准的决策。

3.满意度理解？
这个叫NPS，满意度是用户调研。我们滴滴每天会做用户调研，我们特别关注用户满意度体验。这是今年最重要的发现，提升用户体验，满意度上升下降城市的原因。我们成立了一个NPS团队，专门做分析调研。我们能不能预测大家满意度，我们能不能找出现在满意度发生变化的原因，相对性去改进。其实有个大的人工智能系统，做采集系统和实时预测，今年上半年，体验有了非常大的提高。以前大家认为是运营营销驱动，现在是体验驱动。

滴滴把NPS作为最核心的指标，它没法用模型去优化，滴滴会做调研，后边有大数据，对过程拆解，分析出影响NPS核心的几个因素，哪些用模型项目抓手去优化，拆解到算法。

阅读全文

0 0