机器学习基础(林軒田)笔记之三

来源:互联网 发布:数据分析能干什么 编辑:程序博客网 时间:2024/06/03 18:31

机器学习基础(林軒田)笔记之三

Types of Learning


本章主要介绍各种不同的机器学习问题。

一.Learning with Different Output Space

1.首先复习上节课的二元分类问题。


二值分类 (binary classification):输出为 {+1, -1};


图1中为线性可分的二元分类问题,可用PLA算法求解;图2为带噪声的的二元分类,可用贪婪算法(pocket)求解;图3为多项式可分解。

2.多值分类 (multiclass classification)

多值分类 (multiclass classification):输出为有限个类别,{1, 2, 3, ... , K};


3.回归分析(Regression)

回归分析的输出空间在整个实数集上或者在某个实数范围类。它与二值或者多值分类不一样,它的输出不是一种毫无意义的标记,而是有实际意义的值。

4.结构学习(Structure Learning)

结构学习法是较为复杂的问题,它的输出是一个结构(例如句子中每个词的词性),可以成为假设,通常难以显示的定义该类。

5.小结




二.Learning with Different Data Labels

1.监督学习(Supervised Learning)

训练数据中提供标签,即训练数据中每个x对应一个y,主要用来分类。


2. 无监督学习(unsupervised Learning)

训练数据中不提供标签,主要用在聚类、密度估计、异常检测中。

3.半监督问题(Semi-supervised Learning)

半监督式学习是监督学习和非监督学习的一个折中,它以少量带标记的数据和大量的无标记的数据来学习,在人脸识别,医药效果检测等方面应用。

4. 增强学习(reinforcement Learning )

增强学习是一个非传统的机器学习方式。
增强学习通过隐含的信息进行学习,通常无法表示什么是正确的,可以通过"奖励"好的结果,“惩罚”不好的结果,来优化学习效果。多应用在广告系统,游戏中。

5.总结

监督学习最为重要。


三.Learning with Different Protacol

1.批量学习(Batch Learning)

利用所有已知数据来学习,最常用。

2.在线学习(Online Learning)

通过序列化的接收数据来学习,性能逐渐提高。

3.主动学习(Active Learning)

开始只有少量的标签,机器通过有策略的“提问”来提高性能。

4.总结


四.Learning with Different Input Space

1.离散特征(concrete features)

特征中包含人类智慧,如硬币分类中的特征大小、重量。

2.原始特征(raw features)

这些特征对于学习算法来更加困难,通常需要人或深度学习将其转换为离散特征。

3.抽象特征(Abstract Features)

抽象特征通常无实际意义,需要人为的进行特征转化、提取和在组织。

4.总结


0 0
原创粉丝点击