北大“人工智能前沿与产业趋势”课程整理01

来源:互联网 发布:淘宝开店免费的吗 编辑:程序博客网 时间:2024/06/08 04:42
  1. 第五讲:小米黄江吉-人工智能硬件的发展
  2. 第六讲:碳云王俊-DNA是生命数字化的过程,AI改变生命科学
  3. 第七讲:百度徐伟-AGI 2050年前实现可能性超50%
  4. 第八讲:华为李航-自然语言处理的现象与挑战
  5. 第九讲:滴滴叶杰平-深度学习在交通领域应用潜力巨大

第五讲:小米黄江吉-人工智能硬件的发展

人工智能三大前提:产品+大数据+机器学习;

以小米为例,从手机、电商、家庭路由器、电视云平台、互娱市场、生态链都不断产生数据。这些数据都非常原始,需要清洗。之后是数据挖掘,数据智能

一定要把技术做到产品里面,做到服务里面,它的价值才可以最大化地发挥出来

第六讲:碳云王俊-DNA是生命数字化的过程,AI改变生命科学

碳云智能基于了三个基本假设:生命是可以数字化的;生命是可以被计算的;生命也是可以被网络化的

碳基:碳基的程序是迄今为止最高效存储介质,全世界所有的信息可以存在一公斤的DNA里面,它可以储存上亿年,轻轻松松百万年。我们现在没有哪一种计算机的存储介质可以放一百万年,一个光盘放几十年可能就不行了。DNA是迄今为止最高效的一个存储介质。你要想弄懂生命这个程序,应该做的第一件事情就是把这个程序出来。

中国有一个很出名的计划叫“百分之一计划”,中国参与了人类基因的计划,测定了其中的1%。这个计划是全球三千多名科学家把一个人的基因图谱序列,31个字母读出来。现在一台机器可以在一天内轻松读取一个人的基因图谱,一千美金。这个过程是在十五年之内完成。十五年的时间,从原来一亿美金测一个人的全部基因,到现在的一千美金。除了读人的基因之外,也可以读所有动植物的基因和图谱序列。

每个人的基因都读出来到底有什么用?
1.第一个服务就是出生缺陷。这个世界上有差不多5%到6%的出生缺陷的孩子,出生缺陷的孩子里面有相当大一部分都是跟基因有关。

2.第二个服务就是传染源检测。比如发烧,拉肚子,不知道到底是哪个病毒还是微生物感染,这件事情应该做的是把血液或者粪便里面的DNA提取出来做测序,做完以后发现人体内有没有哪一种微生物感染,或者哪种病毒感染。

3.第二个服务就是个性化用药。因为每个药的开发都是针对于某种基因,某一个代谢通路。肿瘤的发生是跟基因和代谢通路有关,我看我哪个地方的基因坏了,有没有这个药,对应性的来找一找,事实上是这么一个应用的过程。

DNA其实现在已经发展到可以简单拷贝,它是一个数字载体,就像计算机一样,可以简单的被拷贝,克隆就是这样,把一个完整的DNA克隆到另外一个上面。比如说基因编辑,这段DNA31个字母,我想改哪个改哪个,我就把那个字母给它改一改。还有一个进行合成,我计算机里面写一段代码,那边就从试管里合成出来。

测一下基因就知道我得什么病了,这听起来好像很简单的一件事,但生命的复杂程度远远大于这个,我测完了以后我是有了一个起点,但是我最终会怎么样我不知道,因为生命的过程当中有很多的起起伏伏。我怎么才能了解生命本身,只有一个办法就是做一个硅基世界的人工智能的我,做一个数字化的我,能模拟碳基世界的我。在计算机里面有个我,有个王俊,现实生活里面有个王俊,那个王俊不断在学习我这个王俊。如果我所有的特性全部数字化,全部给它,我的每一个输出全部是我最后的训练结果,我能动性的把那个我的数字生命(硅基世界的那个我)变得越来越像碳基世界的这个我,这是碳云要做的一件事。

华大做的事情是读基因,把基因越读越便宜。碳云智能想做的事情就是懂生命。基因事业本身需要做很多东西,首先是建立在碳基里面的一个学习系统,这个学习系统有很多输入,也有很多输出,很多东西要把它数字化。那我数字化什么东西呢,先从DNA的中心法则做起,我的基因序列要知道,我的基因的甲基化要知道,我的RNA要知道,我的蛋白质要知道,我的代谢物要知道,我身体里面,我抽个血,验个尿,粪便里面的各种各样的分子生物学信息全部都知道。一听到这个就头大,好多好多的东西。如果就做个基因还相对简单,就测个序。现在一想这么多数据,怎么办,很多的技术有没有,存不存在,所以碳云在成立之后去做了很多事。做了大规模的收购。

数字生命的程序里,没有一个人的程序是完美的,所有的人都有缺陷,但每一个生命程序都是特别的。你所需要做的事情是把它数字化,找到你最特别的地方,然后再找到你不完美的地方,用你特别的地方去帮助别人的不完美,这就是那个数字生命网络能够达成的最好的东西,而这个东西现在是可以做的。加入这个网络的人越多,这个模型越精准,你能够找到你的特别和你不完美的地方的可能性越大。

生命本身是个旅程,基因是起点,不是终点,在这个过程中,你是你自己的选择,根据你的数字化生命模型做出最好的选择。我希望每个人都能够理性的做越来越好的选择,让身体更健康。

第七讲:百度徐伟-AGI 2050年前实现可能性超50%

什么是通用人工智能(AGI)?

具备执行人类所进行的各种智能任务的能力:感知、决策、推理、规划、沟通。其核心是学习能力:渐进学习、自主学习、交互式学习。

强人工智能具有很强的智能,但并不具有意识?其实只要达到人的智能就可以了,有没有意识不重要。

人类意识究竟是一种对智力的超越,还是其实是智力范畴内的一个东西?其实很多时候我们做出了决策,但自己并不清楚是如何决策的。这似乎是一种非理性的决策,但从更高的层面来看,我们所有的决策都受到我们的历史环境、经济条件等因素的影响。其实你的大脑里面还是有一个很大的函数的,一个F函数,你的历史、环境、人际关系、收入等等综合影响着你的决策。你拍脑袋的决定实际上并不是拍脑袋产生的。之前有一个研究,通过对一个人在社交媒体上点赞的分析,就能得到他的某种情绪模型。然后根据这个模型,可以对这个人对一些言论的反馈做出预测。预测准确度比他身边的人还高。所以说,我们大脑的一些功能,比如人脸识别,可能是笼罩在我们大脑里的极其复杂的运算,我们暂时无法解释而已。但这并不表示它不是运算的结果,而是突然出现的某种神器的东西。比如让人工智能下围棋,最早认为人工智能不可能具有人类下围棋时的那种大局观。但是现在我们看到,人工智能的大局观比人类还好。有时候局面太复杂,人脑也算不出来了。但不管怎么说,这还是一种运算,不管是基于贝叶斯还是基于技术经验。当然这种运算的复杂度很高,人类现在还无法用一个函数把它描述得很清楚。当机器拥有了大量的数据、大量的运算能力后,有可能做得比我们更好,而且有可能每次都很好。人类的灵感不是时时产生的,神来之笔无法每次需要时都产生。当机器智能达到很高的水平之后,这些事情会更大概率的出现。所以说它背后其实还是一种运算。它可能是我们大脑里面一个很神奇的函数,它的最大值是我们的某种价值观,比如个人的幸福感等等。一个人能根据环境、条件等等综合做出一个选择,背后其实是一个很理性的过程。以前我们无法界定什么是幸福感,现在从脑科学的角度来看,它可能是你大脑里某个机构发出了一个信号,多巴胺分泌了一下,然后你就感到了幸福。它并没有那么多神奇的东西,最后还是大脑运算之后激活了一个地方,然后你就幸福了。

机器学习大部分是基于归纳的,人类有演绎和推理的能力,在推理方面,机器现在有没有什么进展?

推理目前还是一个不太成熟的方向,如果这方面的研究越来越好的话,人类能做的事情可能就越来越少了。

有没有一个明确的定义,可以定义通用人工智能达到了人类的水平?

通用人工智能就跟人一样,如果不单独加任何跟开车有关的代码,直接让它学开车,它如果学的速度跟人一样快,或者说直接让它去学数学,它也学的和人一样快,这样就是达到了人类的智能水平。

有没有一种理论能够证明,深度学习模型比其他方法好,还是说这是一种实践的结果?

最重要的还是来自于实践。在实践中取得了这么好的效果后,一些研究者开始尝试从理论上做出解释,它的效果为什么会这么好。最近可能有一些这样的研究,就是在一些特定的模型结构下,在一些假设的状况下,来证明它能找到的解总是和神经网络的全局最优解接近。不过这些研究还是很难解释深度学习最近取得的成功。所以说目前还没有非常完美的理论解释。

第八讲:华为李航-自然语言处理的现象与挑战

我们所说的自然语言理解,学术界有两个定义,一个是基于表示的,你说的话能被计算机映射到其内部的表示,我们认为计算机理解了;另外一个是基于行为的,计算机做出了你指示的行为,后者的定义往往是大家更喜欢采用的。

为什么自然语言理解是非常困难的一件事?

1.语言是不完全有规律的,规律和意外并存,会出现功能冗余,逻辑不一致等情况,如果不遵循规范,交流非常困难,而规范是非常错综复杂的。

2.语言是可以组合的,语言是能把词形成句子,甚至是递归去组织句子,构建出非常复杂的表达。

3.语言的发明创造本身和比喻密切相关,语言的本质是开放的集合,人们可以去发明创造新的表达,一旦形成了以后大家会经常使用,产生新的语义,这是完全开放无穷无尽的。如网络中将“潜水”和沉默不语进行联系,使“潜水”一词出现了新的语义。

4.语言要和世界知识相联系,了解相关的概念和事实。

5.语言的使用是在一个环境里,语言是一种互动,是一个交流的工具。语言终极的理解要结合上下文,结合语境

自然语言处理最核心的想法是基于数据驱动,用机器学习实现,问题可以分为五大数学模型:

分类:将标签分配给字符串,文本分类和情绪识别;
匹配:匹配两个字符串,搜索、问答、(产生式的)单轮对话;
翻译:将一个字符串转换为另外一个,机器翻译、语音识别、手写识别;
结构化预测:将字符串映射到结构,专名识别、词性标注、文本句法分析、文本语义分析;
马尔可夫决策过程:决定下一个状态给予以前的状态和行动,多轮对话;
自然语言处理,考虑是不是实用,一定程度上是看技术的上界和性能下界的关系。不同的用户和场景对性能的要求不同,比如互联网搜索准确度不是极高,但用户都认为很好。

当技术上界遇到用户需求下界,就可以实用化,未来自然语言处理技术常见的应用有以下这些:

语音识别:已经比较实用;
单轮对话:这个方法往往把它变成一个分类问题,或者结构预测的问题;
多轮对话:还很不成熟,特定环境下才能做好;
单轮问答:已经开始实用化(不知道的时候说不知道,反而很有用);
机器翻译:不断提高接近人,但不能完全替代人,本质上和人的做法不同

趋势

趋势一:语音识别、机器翻译已经起飞了,大家都在用,真正对话的翻译还有很长的路要走,说不定能做到很好;
自动语音识别被广泛应用于语言输入

书面语言翻译将在实践中得到更广泛的应用
口语翻译将逐步得到利用和改进
还有待解决的问题,例如长尾挑战(专有名词,语音识别遇到中英文夹杂)
原因:深度学习往往基于统计,解决的是多次重复的东西。长尾现象是一个问题,完全彻底的解决还是比较困难,这是机器学习本质上的局限。

趋势二:单轮问答会越来越实用化,特别是场景驱动的。

趋势三:多轮对话需要更多的研究。
多轮对话本质上是大量学习,人做多轮对话不需要重复很多,是天生能力、这种能否用现有技术模拟和近似,还不是很清楚。多轮对话因为数据不够,不容易解决,这也是未来要研究的方向。多轮对话即使是任务特定,也比较困难,聊天机器人更难了。马尔科夫决策过程都用不上。聊天机器人每一轮都是单轮对话,做不成很合理的多轮对话。多轮对话,如果有任务驱动和有更多数据,可能会越来越好。

总结:

1.自然语言理解很难。
2.自然语言处理现在用数据驱动的办法去做五个最基本的问题,可以分到分类、匹配、翻译、结构预测和马尔克夫决策过程这样一些具体问题上。
3.有了数据我们可以跑这种AI的闭环,不断提高我们系统的性能和算法的能力。
4.深度学习在五个大的任务里面的前四个,都能做的很好,特别是机器翻译,基于任务驱动的单轮对话,应该也能做的越来越好。但是还有很多问题,比如多轮对话需要去研究和解决。

第九讲:滴滴叶杰平-深度学习在交通领域应用潜力巨大

滴滴是12年成立的,先是有出租车,后来到14年有专车,然后15年之后有了快车顺风车公交等等。现在每天订单超过2000万单,所以你要是做人工智能做机器学习,那这个样本量就一天是2000万每天处理的数据是2000TB每天的路径规划是90亿。现在这个平台上有4亿用户

核心项目

ETA意思是从A到B大约需要多长时间,这是滴滴非常核心的一个功能。例如,用户想6点40到达教室,那么多久能打到车,司机接你大概几分钟,如果有预估,那么用户能够更精准地去做决策。

智能分单就是乘客搜索司机。这个过程用时间来预估,越近越好,精准预测三公里之内哪个司机离你最近。第二是司机接到你,然后到目的地大概预估的价钱。预估的价钱本质上是由两个原因决定,即距离和时间。从起点到终点应该怎么走,这是一个非常复杂的问题,每秒要有成千上万个计算,还有A到B的时间大概是多久。结合时间距离以及公式算出预估价,准确度非常重要,准确度对用户也非常关键。滴滴平台上隔5秒钟后再去打车,情况可能完全不一样,几秒钟状态就可能发生很大变化,所以说智能分单的挑战性很大,需要做实时匹配。

Q&A

1.滴滴做的模型上线的时候,对性能的追求和运算质量如何平衡?
我们希望在训练中建立最好的模型,精度越高越好,基础平台搭建了GPU集群,增加计算量,减少计算时间。线上有压力,我们希望模型不是特别复杂,只能挑一个。我们现在在做的,也是业界在研究的一个方向是:模型已经确定好,如何压缩(当计算量大量减少时,尽可能精确)。这是我们探索的一个方向。这个问题部分代表了学术和产业的差异。我们学术上只做第一步,做最好的模型。第二点我们往往忽略,放到线上我们不可能用大量的资源进行计算,落地时,第二点比第一点还要重要,要考虑效率和付出成本。

2.未来五年,出行大交通,深度学习会怎样影响产业,哪些技术带来巨大贡献,机遇和挑战有哪些?
滴滴在智慧交通中和政府合作,政府共享了公交车,摄像头等数据。最终希望各方把数据打通整合起来,才能更加完整刻画交通全貌,做更多决策。这是第一点。第二点是智慧交通,如何把数据整合起来之后解决实际的交通问题,城市的规划建设。滴滴已经在济南实验中看到巨大潜力,更大效率是多方配合合作,更精准反应路况。第三点是智能交通,比如说物联网:车是相连的,车和路上设备也是相连的,做更精准的决策

3.满意度理解?
这个叫NPS,满意度是用户调研。我们滴滴每天会做用户调研,我们特别关注用户满意度体验。这是今年最重要的发现,提升用户体验,满意度上升下降城市的原因。我们成立了一个NPS团队,专门做分析调研。我们能不能预测大家满意度,我们能不能找出现在满意度发生变化的原因,相对性去改进。其实有个大的人工智能系统,做采集系统和实时预测,今年上半年,体验有了非常大的提高。以前大家认为是运营营销驱动,现在是体验驱动

滴滴把NPS作为最核心的指标,它没法用模型去优化,滴滴会做调研,后边有大数据,对过程拆解,分析出影响NPS核心的几个因素,哪些用模型项目抓手去优化,拆解到算法。

阅读全文
0 0
原创粉丝点击