什么是机器学习

来源：互联网发布：农村淘宝地址怎么改编辑：程序博客网时间：2024/06/08 22:23

什么是机器学习？

rthur Samuel将其描述为：“使计算机在没有明确编程的情况下学习的能力的研究领域。”这是一个古老的、非正式的定义。

　　由Tom Mitchell提出，来自卡内基梅隆大学，Tom定义的机器学习是这么啰嗦的，一个好的学习问题定义如下，他说，一个程序被认为能从经验E中学习，解决任务 T，达到性能度量值P，当且仅当，有了经验E后，经过P评判，程序在处理 T 时的性能有所提升。

1.监督学习

　　基本思想是，监督学习中，对于数据集中的每个数据，都有相应的正确答案，（训练集）算法就是基于这些来做出预测。

　　在有监督的学习中，我们得到一个数据集，并且已经知道我们正确的输出应该是什么样子，认为输入和输出之间有一个关系。
　　
　　有监督的学习问题分为“回归”和“分类”问题。在回归问题中，我们试图在连续输出中预测结果，这意味着我们正试图将输入变量映射到一些连续函数。在分类问题中，我们试图用离散输出来预测结果。换句话说，我们正试图将输入变量映射成离散的类别。
例1：
　　给定有关房地产市场规模的数据，尝试预测它们的价格。价格作为大小的函数是连续的输出，所以这是一个回归问题。我们可以把这个例子变成一个分类问题，而不是让我们的输出，关于房子是否“卖得比要价多”。
例2：
（a）回归-给定一个人的照片，我们必须根据给定的图片来预测他们的年龄。
（b）分类-考虑到肿瘤患者，我们必须预测肿瘤是恶性的还是良性的。

２.无监督学习

　　
　　无监督学习使我们能够解决问题，很少或根本不知道我们的结果应该是什么样子。我们可以从数据中提取结构，而我们并不知道变量的影响。我们可以根据数据中变量之间的关系对数据进行聚类，从而得出这种结构。无监督学习没有基于预测结果的反馈。

　　通俗的讲，在无监督学习中我们用的数据会和监督学习里的看起来有些不一样在无监督学习中没有属性或标签这一概念也就是说所有的数据都是一样的没有区别

阅读全文

0 0