学习笔记——吴恩达-机器学习课程-1.3 用神经网络进行监督学习

来源:互联网 发布:淘宝网超市货架 编辑:程序博客网 时间:2024/06/07 04:48
         神经网络有时媒体炒作的很厉害,考虑到它们的使用效果,有些说法还是靠谱的,事实上到目前为止,几乎所有的神经网络创造的经济价值都基于其中一种机器学习,我们称之为“监督学习”,那是什么意思呢?

        我们来看一些例子, 在监督学习中输入x,习得一个函数映射到输出y,比如我们之前看到的应用于房价预测的例子,输入房屋的一些特征,就能输出或者预测价格y。

         下面是一些其他的例子,这些例子中,神经网络拨群,很可能今天通过深度学习获利最大的就是在线广告,这也许不是最鼓舞人心的,但真的很赚钱,给网站输入广告信息,网站会考虑是否你看这个广告,有时还需要输入一些用户信息,神经网络在预测你是否会点击这个广告方面已经表现的很好,通过向你展示,向用户展示最有可能点开的广告,这就是神经网络在很多家公司赚取无法想象的高的额利润的应用方式,因为有了这种向你展示最有可能点开的广告的能力,直接影响到了不少大型线上广告公司的收入,过去的几年里,计算机视觉也有很大进展,这要感谢深度学习,你输入一个图像,然后想输出一个指数,可以是从1-1000来表明这张照片是1000个不同的图像中的某一个,可以用来给照片打标签,深度学习最近在语音识别方面的进展也是令人兴奋的,你可以将音频片段输入神经网络,它可以输出文本,机器翻译也进步很大,这得感谢深度学习,让你有一个神经网络能实现,输入英文句子它直接输出一个中文句子,在无人驾驶技术中,你输入一幅图像,汽车前方的一个快照,还有一些雷达信息,基于这个训练过的神经网络,能告诉你路上其他汽车的位置,这是无人驾驶系统的关键组件,神经网络创造这么多价值的案例中,你要机智地选择x 和y,才能解决特定问题,然后把这个监督学习过的组件嵌入到更大的系统中,比如无人驾驶,可以看出稍微不同的神经网络应用到不同的地方也都行之有效,比如说应用到房地产上,我们上节课看过了,我们用了通用标准的神经网络架构 是吧, 对于房地产和在线广告用的都是相对标准的神经网络,正如我们之前见过的,图像领域里我们经常用的是卷积神经网络,通常缩写为CNN,对于序列数据,例如音频中,有时间成分吧,音频是随着时间播放的,所以音频很自然地被表示为一维时间序列,对于序列数据你经常使用RNN,循环神经络,语言英语和汉语,字母或单词都是逐个出现的,所以语言最自然的表现方式也是序列数据,更复杂的RNNs,经常会用于这些应用对于更复杂的应用,比如无人驾驶,你有一张图片可能需要CNN "卷积神经网络"结构架构去处理,雷达信息会更不一样,你会需要更复杂的混合神经网络结构,所以为了更具体的说明标准的CNN 和RNN结构是什么,在文献中你可能见过这样的图片,在后面的课中我们会去了解这幅图的含义和如它何实现它,这是一个标准的神经网络:





        你可能见过这样的图片,这是一个卷积神经网络,在后续的课程,我们会去了解这幅图的含义和如何实现它,卷积网络通常用于图像数据:


你可能也会看到这样的图片,后续的课程也会去实现它,循环神经网络非常适合处理一维序列数据,其中包含时间成分:


        你可能也听说过机器学习被应用于结构化数据和非结构化数据,下面是这些术语的含义,结构化数据 是数据的数据库,例如 在房价预测中,你可能有一个数据库或者数据列,告诉你房间的大小和卧室数量,这就是结构化数据,在预测用户是否会点击广告的例子中,你可能会有用户信息,比如年龄 还有广告信息,还有你要预测的标签y,这就是结构化数据,意味着每个特征,比如说房屋大小,卧房数量,用户的年龄 都有着清晰的定义;

         相反 非结构化数据指的是比如音频 原始音频,图像,你想要识别图像或文本中的内容,这里的特征可能是图像中的像素值,或者是文本中的单个单词,从历史角度看,非结构化数据与结构化数据相比让计算机理解起来更难,但人类进化到现在,很擅长理解音频信号和图像,文本是一个更近代的发明,但人们真的很擅长解读非结构化数据,神经网络的兴起过程中最令人兴奋的事情之一就是多亏了深度学习,多亏了神经网络,计算机现在能更好地解释非结构化数据,和几年前对比的话,这给我们创造了很多令人兴奋的应用机会,语音识别,图像识别,自然语言文字处理,现在能做的事情比两三年前要丰富多了,我认为因为人们生来就有能力理解非结构化数据,你可能知道 神经网络在非结构化数据上的成功,尤其是媒体,当神经网络识别了一只猫时,那真的很酷,我们都知道 那意味着什么,神经网络在很多短期经济价值的创造是基于结构化数据的,比如更好的广告系统,更好的获利建议,有更好的能力去处理很多公司拥有的海量数据库,并用这些数据准确预测未来趋势,在这门课中,我们会学到很多技巧,可以应用到结构化数据,也可以应用到非结构化数据,为了更清楚地解释算法原理,我们会多用非结构化数据的例子,但当你自己的团队评估了各种神经网络的应用之后,希望你的算法能够同时学习结构化和非结构化数据,神经网络彻底改变了监督学习,整创造着巨大的经济价值,其实呢 基本的神经网络背后的技术理念,大部分都不是新概念,有些甚至有了几十年历史了,那么为什么它们现在才流行,才行之有效呢?
下一级视频中 我们将讨论为什么是最近神经网络才成为你可以使用的强大工具。

本节小结:

1 本节课主要讲述了神经网络的三种结构:

      1.标准的神经网络 

      2.卷积神经网络 

      3. 循环神经网络

2 讲述了三种神经网络的应用场景:

       1. 标准的神经网络主要应用于结构化数据(数据库的数据)

       2.卷积神经网络 主要应用于图像类的应用,比如识别一个图片上是否有一只猫(非结构化数据)

       3. 循环神经网络主要应用于序列数据(非结构化数据),比如 文本识别,音频文件识别等等

3 监督学习的数据分为:结构化数据和非结构化数据

       1.  结构化数据是指我们通常用到的数据库保存的数据

       2.非结构化数据主要包括序列数据(音频是以时间为数据序列的数据格式),图像(矩阵保存像素的数据格式)

阅读全文
0 0