Coursera 机器学习 第一周 学习笔记

来源:互联网 发布:宜居星球知乎 编辑:程序博客网 时间:2024/05/05 08:24

What is machine learning(什么是机器学习)

Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.(机器学习:使计算机在不显式编程的情况下自主学习的能力的研究领域。)Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learnfrom experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. (一个计算机程序据从一些任务T和一些性能度量p中学到经验E,如果它在T上的性能,用P来衡量,则其将不断吸取经验E来改进其程序。)

机器学习的算法的类型:

  • Supervised learning(监督学习)

    通过生成一个函数将输入映射为一个合适的输出(通常也称为标记,多数情况下训练集都是有人工专家标注生成的)。训练集是标记的 。

  • Unsupervised learning(非监督学习)

    与有监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。训练集是未标记的 。


Supervised learning(监督学习)

监督学习主要会提供一些标注样本,分为两大问题:回归和分类

教学案例1:房屋价格预测-回归(Regression): 预测连续的输出值(价格)

这里写图片描述


教学案例2 :乳腺癌(良性,恶性)预测问题-分类(Classification): 预测离散的输出值(0, 1)

这里写图片描述

Unsupervised learning(非监督学习)

常见的无监督学习算法有聚类。
监督学习和无监督学习的对比,看图更形象:

这里写图片描述

这里写图片描述


单参数线性回归 Linear Regression with one variable

以房价为例:


这里写图片描述


利用监督学习当中的回归算法来解决房价问题

这里写图片描述


如何设置 h (预测函数),就是我们需要找到的复合所给数据条件的线性回归算法。

这里写图片描述

我们通过损耗函数来分析所给的h(预测函数)的优劣性。:当然,损耗函数的值越小,说明预测函数越优越。

这里写图片描述


如何找到使得损耗函数的值最小的方法,本课推荐了梯度下降法(gradient descent)。

这里写图片描述

这里写图片描述


Gradient descent 梯度下降算法,可用于寻找最优解

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

梯度下降法与线性回归两者结合:

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述