《Machine Learning》第一讲监督／非监督学习

来源：互联网发布：淘宝hd停止服务编辑：程序博客网时间：2024/06/05 09:00

1.Supervised Learning

给出了实际的输入与输出的结果，然后寻找一个与实际数据相匹配的算法，给出大量的训练样本，来不断的训练这个算法，以至于能够更精确的预测未知结果的用户输入。换句话来说，就是我们给了一组标准输入与标准输出，希望能够从中学习到一个匹配度高的算法，从而在输入未知数据时能够输出更为标准的答案。

Regression problem(回归问题)

训练样本是一系列连续变量的值，用来预测的值也是连续的，所以称为回归问题。

Classification problem(分类问题)

处理一些离散、不连续的数据，数据的属性越多，所建立的坐标系的维数就越高，处理多维数据的聚类问题，就需要用到SVM（支持向量机）的技术，来讲多维数据映射到无限维空间

2.Unsupervised Learning

给出一系列未知结果的数据，也就是说没有加lable的data,来让计算机学习出一个算法，来识别出这片数据之间的联系与区别，主要是完成聚类操作，这个方法在图片的识别（像素的聚类）、社会网络划分、市场划分，语音的提取（混杂的语音解析出一个个单个的语音）

3.Reinforcement Learning

强化学习主要是基于一个reward system（奖励/回报机制），通过定义什么是好的行为，什么是坏的行为，来对机器进行reward 或者punishment，之后就是需要一个学习型算法来弄清楚如何最大化的获取奖励、最小化的受到惩罚。（形象的理解如同训练一只狗一样，想让狗做什么事，做到了就奖励，没做到就惩罚，从而训练狗做你让它做的事）

阅读全文

0 0