机器学习基础(林軒田)笔记之三

来源：互联网发布：数据分析能干什么编辑：程序博客网时间：2024/06/03 18:31

Types of Learning

本章主要介绍各种不同的机器学习问题。

二值分类 (binary classification)：输出为 {+1， -1}；

图1中为线性可分的二元分类问题，可用PLA算法求解；图2为带噪声的的二元分类，可用贪婪算法(pocket)求解；图3为多项式可分解。

多值分类 (multiclass classification)：输出为有限个类别，{1, 2, 3, ... , K}；

回归分析的输出空间在整个实数集上或者在某个实数范围类。它与二值或者多值分类不一样，它的输出不是一种毫无意义的标记，而是有实际意义的值。

结构学习法是较为复杂的问题，它的输出是一个结构(例如句子中每个词的词性)，可以成为假设，通常难以显示的定义该类。

训练数据中提供标签,即训练数据中每个x对应一个y，主要用来分类。

训练数据中不提供标签，主要用在聚类、密度估计、异常检测中。

半监督式学习是监督学习和非监督学习的一个折中，它以少量带标记的数据和大量的无标记的数据来学习，在人脸识别，医药效果检测等方面应用。

增强学习是一个非传统的机器学习方式。

增强学习通过隐含的信息进行学习，通常无法表示什么是正确的，可以通过"奖励"好的结果，“惩罚”不好的结果，来优化学习效果。多应用在广告系统，游戏中。

监督学习最为重要。

利用所有已知数据来学习，最常用。

通过序列化的接收数据来学习，性能逐渐提高。

开始只有少量的标签，机器通过有策略的“提问”来提高性能。

特征中包含人类智慧，如硬币分类中的特征大小、重量。

这些特征对于学习算法来更加困难，通常需要人或深度学习将其转换为离散特征。

抽象特征通常无实际意义，需要人为的进行特征转化、提取和在组织。

0 0