机器学习概述

来源:互联网 发布:怎么加入网络主播 编辑:程序博客网 时间:2024/04/27 18:30

定义

"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."
一个计算机程序从经验E中学习一些任务T和性能度量P,如果它在T中的任务,用P来衡量的话,会随着经验E的提高而提高。

比如:玩跳棋
E = 许多盘下跳棋的经验
T = 下跳棋这个任务
P = 下一次下跳棋获胜的可能性

机器学习分类

任何机器学习问题都可以分为两大类,监督学习(Supervised learning)和非监督学习(Unsupervised learning)

监督学习

在监督学习中,我们得到了一个数据集,并且已经知道我们的正确输出应该是什么样子,因为我们知道输入和输出之间有关系。
监督学习问题被归为“回归”和“分类”问题。在回归问题(regression problem)中,我们试图在一个连续的输出中预测结果,这意味着我们试图将输入变量映射到一些连续函数。在分类问题(classification problem)中,我们试图预测离散输出结果。换句话说,我们试图将输入变量映射到离散的类别中。

举两个栗子:
1. 考虑到房地产市场上房屋的大小,试着预测他们的价格。价格作为一个大小的函数是一个连续的输出,所以这是一个回归问题。
我们可以把这个例子变成一个分类问题,而不是让我们的产出来判断这个房子“卖的比要价多还是少”。“在这里,我们将基于价格的房屋分为两类。
2. (a)回归-根据一个人的照片,我们必须根据给定的图片来预测他们的年龄
(b)分类-给定一个肿瘤患者,我们必须预测肿瘤是恶性的还是良性的。

非监督学习

无监督的学习允许我们在很少或根本不知道我们的结果应该是什么样子的情况下进行研究。我们可以从数据中推导出结构,我们不一定知道变量的影响。
我们可以通过基于数据中的变量之间的关系对数据进行聚类来推导出这种结构。
在无监督学习的基础上,没有基于预测结果的反馈。

举两个栗子:

1.聚类:搜集一百万个不同的基因,并找到一种方法,将这些基因自动分组,这些基因组通过不同的变量(例如寿命,位置,角色等)相似或相关。
2.非聚类:“鸡尾酒会算法”,可以让你在混乱的环境中找到结构。 (即在鸡尾酒会上从声音网格中识别个别的声音和音乐)。


视频资料:

https://www.bilibili.com/video/av9912938/