有监督学习、无监督学习、分类、聚类、回归等概念

来源：互联网发布：天下3英雄榜数据编辑：程序博客网时间：2024/06/03 16:12

特征（feature）
数据的特征。（书的内容。）
标签（label）
数据的标签。如（书属于的类别，例如“计算机”“图形学”“英文书”“教材”等。）
学习（learning）
将很多数据丢给计算机分析，以此来训练该计算机，培养计算机给数据分类的能力。换句话说，学习指的就是找到特征与标签的映射（mapping）关系。这样当有特征而无标签的未知数据输入时，我们就可以通过已有的关系得到未知数据标签。
有监督学习（supervised learning）
不仅把训练数据丢给计算机，而且还把分类的结果（数据具有的标签）也一并丢给计算机分析。
由于计算机在学习的过程中不仅有训练数据，而且有训练结果（标签），因此训练的效果通常不错。训练结束之后进行测试
无监督学习（unsupervised learning）
只给计算机训练数据，不给结果（标签），因此计算机无法准确地知道哪些数据具有哪些标签，只能凭借强大的计算能力分析数据的特征，从而得到一定的成果，通常是得到一些集合，集合内的数据在某些特征上相同或相似。
半监督学习（semi-supervised learning）
给计算机大量训练数据与少量的分类结果（具有同一标签的集合）。
聚类（clustering）
无监督学习的结果。聚类的结果将产生一组集合，集合中的对象与同集合中的对象彼此相似，与其他集合中的对象相异。
分类（classification）
有监督学习的两大应用之一，产生离散的结果。
回归（regression）
有监督学习的两大应用之一，产生连续的结果。

阅读全文

0 0