有监督学习、无监督学习、分类、聚类、回归等概念

来源:互联网 发布:天下3英雄榜数据 编辑:程序博客网 时间:2024/06/03 16:12
  1. 特征(feature)

    数据的特征。(书的内容。)

  2. 标签(label)

    数据的标签。如(书属于的类别,例如“计算机”“图形学”“英文书”“教材”等。)

  3. 学习(learning)

    将很多数据丢给计算机分析,以此来训练该计算机,培养计算机给数据分类的能力。换句话说,学习指的就是找到特征与标签的映射(mapping)关系。这样当有特征而无标签的未知数据输入时,我们就可以通过已有的关系得到未知数据标签。

  4. 有监督学习(supervised learning)

    不仅把训练数据丢给计算机,而且还把分类的结果(数据具有的标签)也一并丢给计算机分析。
    由于计算机在学习的过程中不仅有训练数据,而且有训练结果(标签),因此训练的效果通常不错。训练结束之后进行测试

  5. 无监督学习(unsupervised learning)

    只给计算机训练数据,不给结果(标签),因此计算机无法准确地知道哪些数据具有哪些标签,只能凭借强大的计算能力分析数据的特征,从而得到一定的成果,通常是得到一些集合,集合内的数据在某些特征上相同或相似。

  6. 半监督学习(semi-supervised learning)

    给计算机大量训练数据与少量的分类结果(具有同一标签的集合)。

  7. 聚类(clustering)

    无监督学习的结果。聚类的结果将产生一组集合,集合中的对象与同集合中的对象彼此相似,与其他集合中的对象相异。

  8. 分类(classification)

    有监督学习的两大应用之一,产生离散的结果。

  9. 回归(regression)

    有监督学习的两大应用之一,产生连续的结果。


阅读全文
0 0
原创粉丝点击