Machine learning 监督与无监督

来源：互联网发布：.men域名编辑：程序博客网时间：2024/05/16 12:43

前言：因为对于相关领域的兴趣，有幸观看到Ng大牛的视频，个人以为总结才是最好的理解方式，看过的童鞋也可以参考一下，同时可以指出我一些理解的不足，如有问题，请及时指出，感激不尽。

machine learning

　　machine learning的学习我们首先来看两句非常经典的描述语句。 “the field of study that gives computers the ability to learn without being explicitly programmed.”大意就是在进行特定的编程下给予计算机学习的能力。这是一个非正式的定义。而在ng的说法中我们现在更倾向于下面的这句描述“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.“一个程序被认为能从经验E中学习，解决任务 T，达到性能度量值P，当且仅当，有了经验E后，经过P评判，程序在处理 T 时的性能有所提升。（这句翻译好押韵lol）这在我个人看来是一个反复重复的过程。经验E就相当于让机器去重复一项多次的事项，就好比下棋一样，计算机会去下成千上万盘棋，这样它就有了能够判断下棋时在哪里去下下一步的能力，这其实也就相当于解决任务T，而性能度量值P就相当于面对一个对手时它的胜率，这就是一个度量标准，而在一盘接一盘的下棋过程中，不断地解决任务，P也就会随之提升，以此达到我们需要的标准。阿尔法大概也是如此。

Supervised Learning（监督学习）

　　机器学习的常用方法，主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。监督学习同时也分为两种一种是回归问题，最简单的例子就是给你一组大量的数据，让你去预测一项数据，你可能无法给出一个准确的数值，但是我们可以利用线性回归来预测它的可靠值。而另一种监督学习的方法则是分类，分类也是给定我们一大堆的数据，但是我们需要的预测结果是有限的，也就是给定的，举个简单的例子，这个东西能不能卖出去，我们可以给的结果只能是能或者不能，而线性回归则好比这个东西我们能卖出去多少钱，最终价格可能并不是这个数值但也不会相差过大。回归问题。即通过回归来预测一个连续值输出。分类问题，目标是预测离散值输出。

Unsupervised Learning（无监督学习）

　　上面说过了监督学习，那相对的就有无监督学习。监督学习的算法会要求我们的能够分辨一个事务是好是坏不论是单一的分类，亦或是大量分析中的离散回归。我们对需要给定的一些确定的数据，是好是坏是多是少我们都需要给定的一个标准来去判断这些东西。但是假设如果我们没有给定这个标准，然后把一批数据交给机器（machine）呢？这就需要我们所说的无监督学习了，设计一种无监督学习的算法的核心不在于预测。而是在于一个分类。无监督学习的算法不需要给定一个特定的标签或属性的概念，所以在无监督学习中我们只有一个数据集没人告诉我们该怎么做我们也不知道每个数据点究竟是什么意思相反它只告诉我们现在有一个数据集你能把它分类，我们可以把很大量的数据分成单一的几个聚类。而这种算法，就是我们所需求的，而我们这种分聚类的算法，称为无监督学习。
　　A computer program is said to learn from experience E with
respect to some task T and some performance measure P if its
performance on T, as measured by P, improves with experience E.
Suppose we feed a learning algorithm a lot of historical weather
data, and have it learn to predict weather. What would be a
reasonable choice for P?
这里写图片描述
这是其中的一到题，应该来讲十分简单，有兴趣的童鞋可以尝试一下。我将会在下一篇中给出答案。
PS：在下一篇博客中我将会总结一下Ng的线性回归的算法，这是一个非常实用的监督学习的算法，在后面的博客中我会尽量精简一下其中的内容。同时，在学习的过程中我深刻地体会到了语言的重要性（心累）、

1 0