Lecture 2: Supervised machine learning
来源:互联网 发布:知已知彼百战不殆 编辑:程序博客网 时间:2024/05/16 11:04
这周主要讲监督学习
首先介绍了下监督学习的概念以及过拟合和欠拟合,这些就不再赘述了。
K邻近法对数据的结构没有做假设,虽然预测较为正确,但是通常不稳定。
线性拟合对数据的结构做了些假设,结果较为稳定,但可能不太精确。
如果有大量的特征,尤其是很多特征值为0的情况下,最好不要用K邻近法。
SVM支持向量机,SVM可以用于classification和regression。
具体可以参考《统计机器学习》一书,里面讲的非常清楚。
需要注意的是对dataset进行预处理,会大大提高test accuracy。
Summary
Cross-validation
不同于之前介绍的简单的将数据分为train dataset 和 test dataset,这里将数据分为n个folder,训练n个model,分别用第n个folder的数据作为 test set。这样对模型的评估更加可靠。还可以采用scikit里面的cross_validation函数来观察parameter对于模型的影响。
Decision Tree
具体也可参考《统计机器学习》,这里主要介绍了防止overfitting的方法:
pre-pruning,也就是early stop,防止decision tree变得过于复杂。
post-pruning,先建立一个复杂的decision tree,之后再将其调整为一个简单的decision tree。
scikit-learn只完成了pre-pruning,可以控制最大的深度,或者最多的节点数量等
Summary
阅读全文
0 0
- Lecture 2: Supervised machine learning
- Lecture4: Supervised Machine Learning
- [machine learning]ng lecture
- Machine Learning Algorithms Study Notes--Supervised Learning
- 【Machine Learning】笔记:Semi-supervised learning
- Stanford Machine Learning - Lecture 01
- 【Stanford Machine Learning】Lecture 2--Linear Regression with Multiple Variables
- Andrew Ng的 Machine Learning 读书笔记 Lecture 2
- (机器学习基石)Machine Learning Foundations:Lecture 2
- [Machine Learning][inrial lecture] and Category Representation
- Machine Learning机器学习 - Supervised Learning监督学习 - Native Bayes
- Machine Learning Class 1:Introduction,supervised & unsupervised learning
- 1-3,1-4:machine Learning and supervised Learning
- Machine Learning Foundation Lecture 03 Type Of Learning 学习笔记
- Machine Learning Foundation Lecture 04 Feasuibility of learning 学习笔记
- 「Machine Learning」Learning Theory from CS229 Lecture Notes
- 论文读书笔记-Supervised machine learning:a review of classification techniques
- 机器学习中的神经网络Neural Networks for Machine Learning:Lecture 2 Quiz
- Spring(1-1、基于xml装配Bean)
- C8051F没有无法进main函数的解决办法之一
- 解决IIS+PHP出现的“500
- 7. Reverse Integer
- Java基础教程18-方法传参和返回值
- Lecture 2: Supervised machine learning
- http协议无状态中的 "状态" 到底指的是什么?!
- Ancient Cipher
- 程序员面试金典——实时中位数_
- vue2.0实战案例之高级教程-老孟编程
- 四、5、Date类型及方法
- POJ3155_Hard Life_二分求解分数规划||最大权闭合图
- POJ 1969 Count on Canton 笔记
- 文章标题