Andrew Ng ML课程总结(一)

来源:互联网 发布:网络棋牌游戏赚钱吗 编辑:程序博客网 时间:2024/06/05 02:04

大致内容

   这些文章(包括接下来要写的几篇)是关于Andrew Ng(吴恩达) 在Stanford 机器学习的公开课的总结,视频在网易上有中英文字幕版,coursera上也有对应课程。Andrew Ng其人是人工智能方面的大牛,不必过多介绍。

下面是第一讲的内容

  • 机器学习动机与应用

机器学习的定义:Arthur Samuel 与TomMitchell 的定义略有不同。Arthur Samuel被称为“pioneer of artificial intelligence research”,创造了第一个自学习的程序即他的西洋棋程序,他对机器学习的定义是“Field of study that gives computers the ability to learn without being explicitly programmed”。Tom Mitchell给出的定义更加形式化,而且被广泛引用:“for任务T 和度量方法P,如果一个程序在T 上以P 衡量的性能随着经验E 而自我完善,那么我们称这个程序在经验E 中学习“。

  • 课程大致内容

主要包括监督学习、无监督学习、学习理论、加强学习四个方面

监督学习(Supervised Learning),就是基于标记数据的学习。举例来看,有回归问题(Regression)和分类问题(Classification),在这里回归问题以连续数据为例(房屋价格根据其面积的预测,事实上房屋价格严格地说是离散数据)而分类问题以离散数据(用肿瘤大小来判断良性恶性)为例,更大的意义上说这二者的应用都不限于此。

无监督学习(Unsupervised Learning),数据是没有被标记的学习,即没有对具体的学习样本规定对应的输出结果。比如聚类问题;另外吴举了一个通过对图片聚类来构建3D 模型的例子(这个做的非常好,类似的效果可以参考百度地图的街景);还有一个例子是去除噪声的滤波问题,所谓的”鸡尾酒会问题“,令人惊讶的是他说matlab一行代码可以搞定。

加强学习(Reinforcement Learning),加强学习的核心是回报函数,通过定义行为的好坏,以及采用的趋好避坏的算法,可以在学习后让程序有一系列”正确的“行为。吴举的例子是自动驾驶直升飞机的倒飞,机器动物的爬越障碍等。

学习理论(Learning Theory),研究如何选择算法,如何验证算法的有效性,如何求得算法需要的数据量等。

0 0
原创粉丝点击