斯坦福机器学习网易公开课笔记1

来源：互联网发布：康威摄像头软件编辑：程序博客网时间：2024/04/29 17:17

之前在coursera上看了Andrew Ng的机器学习课程，那个课程比较简明，适合对机器学习有一个整体的印象，但是很多细节的内容和推导都忽略了。现在想要了解机器学习更多，所以开始看Andrew Ng在网易公开课上的机器学习课程，并对每一讲整理笔记，以促使自己更好的理解和记忆。

第一讲中对机器学习给出了两个定义。第一个定义是1959年Arthur Samuel 提出的“Field of study that gives computers the ability to learn withoutbeing explicitly programmed”。这个定义不是那么正式，Arthur Samuel还写了一个西洋棋程序。1998年Tom Mitchell 提出了机器学习更加形式化的定义：“A computer program is said to learn from experience E with respectto some task T and some performance measure P, if its performance to T, asmeasured by P, improves with experience E.”

接着从总体上介绍了在接下来的课程中我们将要学习四个部分的内容，监督学习、学习理论、无监督学习、强化学习。

第一部分是监督学习，是基于有标签的数据。课程中举得监督学习的例子有根据房屋的面积预测房价的问题。因为要预测的房价是连续的，所以也称为回归问题。另外一个监督学习的例子是根据肿瘤大小预测是否是恶性肿瘤的问题。因为预测结果是离散的，也称为分类问题。在监督学习中数据的属性（称为特征）可以是多个的，例如在预测是否是恶性肿瘤的问题中，数据可以有肿瘤大小、病人的年龄、细胞形状的一致性等多个特征。

第二部分是学习理论，这部分会介绍如何证明算法的收敛性、如何选择模型来得到更好的效果、应该选用多大的数据集，如何debug算法等。

第三部分是无监督学习，是基于无标签的数据。无监督学习算法可以学习到数据集中的结构，课程中举得无监督学习的例子有利用聚类算法对图像中的像素聚类，将图像分成不同的区域，以应用在计算机视觉、图像处理等问题中，例如建立图片的三维模型。课程中还举了一个鸡尾酒聚会的例子，在聚会上很多人同时讲话的场景中，分离出一个人的语音。

第四部分是强化学习，是基于回报函数利用学习型算法进行学习，应用在需要作出一系列的决策的场景中。课程中举得例子是直升机飞行的例子。在直升机飞行中需要作出一系列正确的决策才会让飞机飞行起来，与此相反的是在预测是否是恶性肿瘤的问题中，对病人只需要做出一个决策，是否是恶性肿瘤。

0 0