机器学习日记12月4日学习心得（短）

来源：互联网发布：用c语言实现汉诺塔算法编辑：程序博客网时间：2024/05/17 16:14

今天学习了Coursera吴恩达机器学习的课程，第一节的介绍，也许在其他地方也看到过类似的，所以也算比较了解了这个知识。这节介绍了什么是机器学习，以及机器学习的分类监督学习和无监督学习。下面一些内容是coursera学习过程中的笔记。

什么是机器学习？

提供了机器学习的两个定义。亚瑟·塞缪尔（Arthur Samuel）将其描述为：“使计算机能够学习而不被明确编程的学习领域”。这是一个较老的，非正式的定义。

汤姆·米切尔（Tom Mitchell）提出了一个更现代的定义：“计算机程序被认为是从经验E学习一些类别的任务T和性能测量P，如果它在P的任务中的性能由P测量， “

例如：玩跳棋。

E =玩许多棋子游戏的经验

T =玩跳棋的任务。

P =程序将赢得下一场比赛的概率。

一般来说，任何机器学习问题都可以分配到两大类中的一个：

有监督学习和无监督学习。

监督学习就是给定已知结果的数据来做预测。

例1：

给定关于房地产市场上房屋大小的数据，试着预测它们的价格。作为尺寸函数的价格是一个连续的输出，所以这是一个回归问题。

我们可以把这个例子变成一个分类问题，而不是把这个房子“卖出多少要价”。在这里，我们将基于价格的房屋分为两类。

例2：

（a）回归 - 给定一个人的照片，我们必须根据给定的图片来预测他们的年龄

（b）分类 - 给予患有肿瘤的患者，我们必须预测肿瘤是恶性的还是良性的。

无监督学习就是给一堆数据找特征点分类。聚类是无监督学习的一种。

例：

聚类：搜集一百万个不同的基因，并找到一种方法，将这些基因自动分组，这些基因组通过不同的变量（例如寿命，位置，角色等）相似或相关。

非聚类：“鸡尾酒会算法”，可以让你在混乱的环境中找到结构。（即在鸡尾酒会上识别个人声音和音乐网格中的音乐）。

完成

阅读全文

1 0