Andrew Ng ML课程总结（一）

来源：互联网发布：网络棋牌游戏赚钱吗编辑：程序博客网时间：2024/06/05 02:04

大致内容

   这些文章（包括接下来要写的几篇）是关于Andrew Ng（吴恩达） 在Stanford 机器学习的公开课的总结，视频在网易上有中英文字幕版，coursera上也有对应课程。Andrew Ng其人是人工智能方面的大牛，不必过多介绍。

下面是第一讲的内容

机器学习动机与应用

机器学习的定义：Arthur Samuel 与TomMitchell 的定义略有不同。Arthur Samuel被称为“pioneer of artificial intelligence research”，创造了第一个自学习的程序即他的西洋棋程序，他对机器学习的定义是“Field of study that gives computers the ability to learn without being explicitly programmed”。Tom Mitchell给出的定义更加形式化，而且被广泛引用：“for任务T 和度量方法P，如果一个程序在T 上以P 衡量的性能随着经验E 而自我完善，那么我们称这个程序在经验E 中学习“。

课程大致内容

主要包括监督学习、无监督学习、学习理论、加强学习四个方面

监督学习（Supervised Learning），就是基于标记数据的学习。举例来看，有回归问题（Regression）和分类问题（Classification），在这里回归问题以连续数据为例（房屋价格根据其面积的预测，事实上房屋价格严格地说是离散数据）而分类问题以离散数据（用肿瘤大小来判断良性恶性）为例，更大的意义上说这二者的应用都不限于此。

无监督学习（Unsupervised Learning），数据是没有被标记的学习，即没有对具体的学习样本规定对应的输出结果。比如聚类问题；另外吴举了一个通过对图片聚类来构建3D 模型的例子（这个做的非常好，类似的效果可以参考百度地图的街景）；还有一个例子是去除噪声的滤波问题，所谓的”鸡尾酒会问题“，令人惊讶的是他说matlab一行代码可以搞定。

加强学习（Reinforcement Learning），加强学习的核心是回报函数，通过定义行为的好坏，以及采用的趋好避坏的算法，可以在学习后让程序有一系列”正确的“行为。吴举的例子是自动驾驶直升飞机的倒飞，机器动物的爬越障碍等。

学习理论（Learning Theory），研究如何选择算法，如何验证算法的有效性，如何求得算法需要的数据量等。

0 0