深度学习框架-Tensorflow案例实战视频课程

来源:互联网 发布:千驮谷日本语学校 知乎 编辑:程序博客网 时间:2024/05/16 08:14
随笔背景:在很多时候,很多入门不久的朋友都会问我:我是从其他语言转到程序开发的,有没有一些基础性的资料给我们学习学习呢,你的框架感觉一下太大了,希望有个循序渐进的教程或者视频来学习就好了。对于学习有困难不知道如何提升自己可以加扣:1225462853进行交流得到帮助,获取学习资料.


CP1621-唐宇迪-python数据分析与机器实战


下载地址:http://pan.baidu.com/s/1jI05TPW


数学原理推导与案例实战紧密结合,由机器学习经典算法过度到深度学习的世界,结合深度学习两大主流框架Caffe与Tensorflow,选择经典项目实战人脸检测与验证码识别。原理推导,形象解读,案例实战缺一不可!


Tensorflow是谷歌开源的深度学习(包括机器学习)框架,伴随着人公智能业的兴盛其大名早已响彻云霄。本课程从Tensorflow的安装开始讲起,从基本计算结构到深度学习各大神经网络,全程案例代码实战,一步步带大家入门如何使用Tensorflow玩转深度学习。


现在,我们终于要谈到深度学习了!


深度学习就是这样一种在表达能力上灵活多变,同时又允许计算机不断尝试,直到最终逼近目标的一种机器学习方法。从数学本质上说,深度学习与前面谈到的传统机器学习方法并没有实质性差别,都是希望在高维空间中,根据对象特征,将不同类别的对象区分开来。但深度学习的表达能力,与传统机器学习相比,却有着天壤之别。


简单地说,深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。


这么说还是太抽象,太难懂。我们换一种更直观的讲法。


假设深度学习要处理的数据是信息的 “水流”,而处理数据的深度学习网络是一个由管道和阀门组成的巨大的水管网络。网络的入口是若干管道开口,网络的出口也是若干管道开口。这个水管网络有许多层,每一层有许多个可以控制水流流向与流量的调节阀。根据不同任务的需要,水管网络的层数、每层的调节阀数量可以有不同的变化组合。对复杂任务来说,调节阀的总数可以成千上万甚至更多。水管网络中,每一层的每个调节阀都通过水管与下一层的所有调节阀连接起来,组成一个从前到后,逐层完全连通的水流系统(这里说的是一种比较基本的情况,不同的深度学习模型,在水管的安装和连接方式上,是有差别的)。


有一种算法非常简单,模仿的是小朋友学识字的思路。家长和老师们可能都有这样的经验:小朋友开始学识字,比如先教小朋友分辨 “一”、“二”、“三” 时,我们会告诉小朋友说,一笔写成的字是 “一”,两笔写成的字是 “二”,三笔写成的字是 “三”。这个规律好记又好用。但是,开始学新字时,这个规律就未必奏效了。比如,“口” 也是三笔,可它却不是 “三”。我们通常会告诉小朋友,围成个方框儿的是 “口”,排成横排的是 “三”。这规律又丰富了一层,但仍然禁不住识字数量的增长。很快,小朋友就发现,“田” 也是个方框儿,可它不是 “口”。我们这时会告诉小朋友,方框里有个 “十” 的是 “田”。再往后,我们多半就要告诉小朋友,“田” 上面出头是 “由”,下面出头是 “甲”,上下都出头是 “申”。很多小朋友就是在这样一步一步丰富起来的特征规律的指引下,慢慢学会自己总结规律,自己记住新的汉字,并进而学会几千个汉字的。


有一种名叫决策树的机器学习方法,就和上面根据特征规律来识字的过程非常相似。当计算机只需要认识 “一”、“二”、“三” 这三个字时,计算机只要数一下要识别的汉字的笔画数量,就可以分辨出来了。当我们为待识别汉字集(训练数据集)增加 “口” 和 “田” 时,计算机之前的判定方法失败,就必须引入其他判定条件。由此一步步推进,计算机就能认识越来越多的字。



附图显示了计算机学习 “由”、“甲”、“申” 这三个新汉字前后,计算机内部的决策树的不同。这说明,当我们给计算机 “看” 了三个新汉字及其特征后,计算机就像小朋友那样,总结并记住了新的规律,“认识” 了更多的汉字。这个过程,就是一种最基本的机器学习了。


当然,这种基于决策树的学习方法太简单了,很难扩展,也很难适应现实世界的不同情况。于是,科学家和工程师们陆续发明出了许许多多不同的机器学习方法。


例如,我们可以把汉字 “由”、“甲”、“申” 的特征,包括有没有出头,笔画间的位置关系等,映射到某个特定空间里的一个点(我知道,这里又出现数学术语了。不过这不重要,是否理解 “映射” 的真实含义,完全不影响后续阅读)。也就是说,训练数据集中,这三个字的大量不同写法,在计算机看来就变成了空间中的一大堆点。只要我们对每个字的特征提取得足够好,空间中的一大堆点就会大致分布在三个不同的范围里。


这时,让计算机观察这些点的规律,看能不能用一种简明的分割方法(比如在空间中画直线),把空间分割成几个相互独立的区域,尽量使得训练数据集中每个字对应的点都位于同一个区域内。如果这种分割是可行的,就说明计算机 “学” 到了这些字在空间中的分布规律,为这些字建立了模型。

阅读全文
1 0
原创粉丝点击