吴恩达deeplearning.ai课程系列笔记01

来源:互联网 发布:网络音乐盛典歌曲 编辑:程序博客网 时间:2024/06/05 00:36

#写在最前,deeplearning.ai系列课程相较于之前的Andrew Ng在coursea上2014发布的机器学习课程内容更加丰富。
重要的是此次课程示例代码都是用python来实现,不需要去熟悉octave,对大部分需要用python来学习机器学习的同学来说是个福音!
原课程视频请移步网易云课堂或者coursea上学习。

#本文内容部分来自网络,只为自己学习以及分享供更多的人学习使用微笑

关于课程内容与你将获得的收获:

摘自课程视频:

本课程教你如何在实际工作中利用深度学习,而不仅仅是了解深度学习的简单描述知识。

所以在完成本课程的学习之后,您应该能够在你的应用中使用深度学习技术。

如果您正在寻找一份AI相关的工作,那么在本课程学习完成之后,您可以回答一些基本面试问题。

主要分为两类,包括监督学习和无监督学习:

举个最近的例子,以前版本的AlphaGo就属于监督学习的例子,因为需要前期输入数据,从前人的经验中学习,

而DeepMind最近推出的新版本AlphaGo Zero则属于无监督学习的例子,完全从零开始,功能相当强大。


1、神经网络

首先,要知道什么是神经网络?

举个小栗子:

如果要预测房屋的价格,如图所示,家庭人口、步行化程度以及学校的质量都能帮助你预测房屋的价格。

以此为例, x 是所有的这四个输入, y是你尝试预测的价格,把这些单个的神经元叠加在一起,我们就有了一个稍微大一点的神经网络。



2、监督学习

在监督学习中,我们需要给定一些训练数据,包含对应的输入和输出。

通过这些数据,我们可以训练出一个模型,根据该模型,可以用于预测其他的输入对应的输出可能会是什么。


目前,一个应用的非常多的场景是在线广告。它可以根据该用户的习惯来预测该用户对哪些广告信息点击的可能性更大来给用户有选择的推荐广告,从而提高广告的推广作用。

对于图像相关的应用,通常卷积神经网络(CNN)可以发挥更大的优势。

对于语音等与时间序列相关的应用,递归神经网络(RNN)则更为适用。

下图表示的是一个标准结构的神经网络。

卷积神经网络常用用于处理图像相关的应用。卷积神经网络的结构如下:

循环神经网络常常用于与时间序列有关的数据。其基本结构如下:


在机器学习领域,我们通常将输入数据非为结构化数据和非结构化数据两类。

结构化数据意味着数据的基本数据库。例如在房价预测中,你可能有一个数据库,有专门的几列数据告诉你卧室的大小和数量,这就是结构化数据。或预测用户是否会点击广告,你可能会得到关于用户的信息,比如年龄以及关于广告的一些信息,然后对你的预测分类标注,这就是结构化数据,意思是每个特征,比如说房屋大小卧室数量,或者是一个用户的年龄,都有一个很好的定义。相反非结构化数据是指比如音频,原始音频或者你想要识别的图像或文本中的内容。这里的特征可能是图像中的像素值或文本中的单个单词。

相对结构化数据而言,计算机对于非结构化的数据更加地难以理解和处理。

从历史经验上看,处理非结构化数据是很难的,与结构化数据比较,让计算机理解非结构化数据很难,而人类进化得非常善于理解音频信号和图像,文本是一个更近代的发明,但是人们真的很擅长解读非结构化数据。

3、无监督学习

不同于监督学习的数据的样子,无监督学习中没有任何的标签或者是有相同的标签或者就是没标签。

无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。

聚类应用的一个例子就是在谷歌新闻中。

谷歌新闻每天都在,收集非常多,非常多的网络的新闻内容。

它再将这些新闻分组,组成有关联的新闻。所以谷歌新闻做的就是搜索非常多的新闻事件,自动地把它们聚类到一起。


4、深度学习相关

对于深度学习而言,想要发挥其优势需要满足以下三点:

1 足够的数据量:若数据量不足,则无法发挥深度学习的优势

2 足够的计算能力:若计算能力不足,则无法快速训练得到模型,不具备实际意义。

3 优秀的算法:优秀的算法可以在相同的数据量和计算能力时,得到更好的性能。同时,一些算法也可以简化计算,提高计算效率,例如用ReLU替换sigmod函数。

在深度学习的研究与应用过程中,整理流程通常如下:

1 提出一个想法

2 编程进行实现

3 训练得到模型并验证算法性能

4 分析并提出新的想法进行改进



原创粉丝点击