Andrew Ng机器学习笔记week6 机器学习的应用与设计

来源:互联网 发布:明星一年真实收入知乎 编辑:程序博客网 时间:2024/06/05 04:17

机器学习应用中的建议

1、如何debug一个学习算法

这里写图片描述

2、如何评估一个假设h(x)

这里写图片描述
这里写图片描述

3、模型的选择、训练集、检验集、测试集

这里写图片描述
将数据集合分为三部分,训练集占60%,检验集(Class Validation)占20%,最后测试集占20%

4、bias VS variance

这里写图片描述
这里写图片描述
这里写图片描述

5、正则化和偏差(bias)、方差(variance)

这里写图片描述
这里写图片描述
这里写图片描述

6、神经网络的过拟合

这里写图片描述

7、学习曲线

这里写图片描述
这里写图片描述
这里写图片描述

机器学习系统设计

垃圾分类系统举例

1、特征向量←某些问题是否在邮件中出现 选取特征x

这里写图片描述
①收集样本
②基于邮件的路由信息推出一些复杂特征
③基于邮件的正文信息推出一些复杂特征
④用一些复杂算法来检测拼写错误

2、误差分析

这里写图片描述
这里写图片描述
其中,stemmer–词干分析器

3、Error metrics for skewed classes 类偏斜的误差矩阵

这里写图片描述
查准率和查全率
这里写图片描述

4、P、R、F1score

这里写图片描述
这里写图片描述

5、数据

这里写图片描述
这里写图片描述