Ng机器学习01

来源:互联网 发布:python idle官方下载 编辑:程序博客网 时间:2024/05/17 23:42

  • 何为机器学习
    • 有监督学习
      • 例一
      • 例二
    • 无监督学习

何为机器学习?

对于机器学习(Machine Learning)的定义大体上有两种,第一种是美国人Arthur Samuel提出的,Arthur本人亦是人工智能(AI)的先驱。其定义如下:机器学习是通过给予电脑在为做特定编写程序的前提下具备学习得能力。这种定义是较为古老、非正式的定义。现代机器学习教父Tom Mitchell先生对于机器学习给出了第二种较为现代的定义:通过从相关的任务T下的经验E中学习,其行为的表现用P来测量,计算机程序在不断的学习下,它对于任务T下的表现通过P测量,P随着经验E不断增长。

这里提出对于机器学习的一般分类:无监督下的学习和有监督下的学习。

有监督学习

在有监督的学习模型下,我们给定的数据集是已知正确的输出结果,在输入和输出之间关系。


Supervised Learning

一般有监督的学习问题可以划分为:回归和分类问题。在回归问题中,我们试图预测出连续输出的结果,意味着我们根据输入变量(关系)描绘出连续的函数。对于分类问题,我们试图根据离散结果预测结果。总而言之,我们尝试以离散的分类关系描绘输入变量。

例一

给出实际市场上房屋的尺寸数据集,试图预测这些房子的价格。价格作为尺寸的函数关系是连续的输出,因此,这是一个回归问题。


House Price

我们也可以通过关心房价高于或低于给定要求价格而非推测其售出价格,进而将这一问题转变为分类问题,这里我们依照价格将其分为两类。

例二

(1)回归问题:对给出的一个人的照片,我们以此照片为基础预测该人的年龄。

(2)分类问题:已知意味病人体内后有肿瘤,我们试图预测该肿瘤是良性或恶性。


肿瘤大小

无监督学习

无监督学习下,我们在对应该的输出结果并不知道或知道很少下解决问题的方式。我们可以从并不必要知道变量作用下从数据中划分结构。总之,在无监督下,没有基于预测结果的反馈。


Unsupervised Learning

簇:收集了100万的基因组,将这些基因组自动划分为多个小组,分类依据按照不同基因变量中相同的成分,如位置,角色,寿命等。

非-簇:鸡尾酒舞会算法,使你在吵杂的环境下寻找结构(如:在鸡尾酒舞会中将个人的交谈声和音乐声做分离)。

原创粉丝点击