什么是机器学习

来源:互联网 发布:农村淘宝地址怎么改 编辑:程序博客网 时间:2024/06/08 22:23

什么是机器学习?

rthur Samuel将其描述为:“使计算机在没有明确编程的情况下学习的能力的研究领域。”这是一个古老的、非正式的定义。

  由Tom Mitchell提出,来自卡内基梅隆大学,Tom定义的机器学习是 这么啰嗦的,一个好的学习问题定义如下,他说, 一个程序被认为能从经验E中学习,解决任务 T,达到 性能度量值P,当且仅当,有了经验E后,经过P评判, 程序在处理 T 时的性能有所提升。

1.监督学习

  基本思想是,监督学习中,对于数据集中的每个数据, 都有相应的正确答案,(训练集) 算法就是基于这些来做出预测。

  在有监督的学习中,我们得到一个数据集,并且已经知道我们正确的输出应该是什么样子,认为输入和输出之间有一个关系。
  
  有监督的学习问题分为“回归”和“分类”问题。在回归问题中,我们试图在连续输出中预测结果,这意味着我们正试图将输入变量映射到一些连续函数。在分类问题中,我们试图用离散输出来预测结果。换句话说,我们正试图将输入变量映射成离散的类别。
例1:
  给定有关房地产市场规模的数据,尝试预测它们的价格。价格作为大小的函数是连续的输出,所以这是一个回归问题。我们可以把这个例子变成一个分类问题,而不是让我们的输出,关于房子是否“卖得比要价多”。
例2:
(a)回归-给定一个人的照片,我们必须根据给定的图片来预测他们的年龄。
(b)分类-考虑到肿瘤患者,我们必须预测肿瘤是恶性的还是良性的。

2.无监督学习

  
  无监督学习使我们能够解决问题,很少或根本不知道我们的结果应该是什么样子。我们可以从数据中提取结构,而我们并不知道变量的影响。我们可以根据数据中变量之间的关系对数据进行聚类,从而得出这种结构。无监督学习没有基于预测结果的反馈。

  通俗的讲,在无监督学习中 我们用的数据会和监督学习里的看起来有些不一样 在无监督学习中 没有属性或标签这一概念 也就是说所有的数据 都是一样的 没有区别

原创粉丝点击