机器学习日记12月4日学习心得(短)

来源:互联网 发布:用c语言实现汉诺塔算法 编辑:程序博客网 时间:2024/05/17 16:14

今天学习了Coursera吴恩达机器学习的课程,第一节的介绍,也许在其他地方也看到过类似的,所以也算比较了解了这个知识。这节介绍了什么是机器学习,以及机器学习的分类 监督学习和无监督学习。下面一些内容是coursera学习过程中的笔记。

什么是机器学习?

提供了机器学习的两个定义。亚瑟·塞缪尔(Arthur Samuel)将其描述为:“使计算机能够学习而不被明确编程的学习领域”。这是一个较老的,非正式的定义。

汤姆·米切尔(Tom Mitchell)提出了一个更现代的定义:“计算机程序被认为是从经验E学习一些类别的任务T和性能测量P,如果它在P的任务中的性能由P测量, “

例如:玩跳棋。

E =玩许多棋子游戏的经验

T =玩跳棋的任务。

P =程序将赢得下一场比赛的概率。

一般来说,任何机器学习问题都可以分配到两大类中的一个:

有监督学习和无监督学习。


监督学习就是给定已知结果的数据来做预测。


例1:

给定关于房地产市场上房屋大小的数据,试着预测它们的价格。作为尺寸函数的价格是一个连续的输出,所以这是一个回归问题。

我们可以把这个例子变成一个分类问题,而不是把这个房子“卖出多少要价”。在这里,我们将基于价格的房屋分为两类。

例2

(a)回归 - 给定一个人的照片,我们必须根据给定的图片来预测他们的年龄

(b)分类 - 给予患有肿瘤的患者,我们必须预测肿瘤是恶性的还是良性的。


无监督学习就是给一堆数据找特征点分类。聚类是无监督学习的一种。

例:

聚类:搜集一百万个不同的基因,并找到一种方法,将这些基因自动分组,这些基因组通过不同的变量(例如寿命,位置,角色等)相似或相关。

非聚类:“鸡尾酒会算法”,可以让你在混乱的环境中找到结构。(即在鸡尾酒会上识别个人声音和音乐网格中的音乐)。

 完成

原创粉丝点击