转:30分钟学会用scikit-learn的基本分类方法(决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
来源:互联网 发布:乐乎lofter帅哥 编辑:程序博客网 时间:2024/05/20 09:09
关于回归方法,请参考我的另一篇博客30分钟学会用scikit-learn的基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
本文主要参考了scikit-learn的官方网站
1. 数据准备
关于分类,我们使用了Iris数据集,这个scikit-learn自带了.
Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
注意,Iris数据集给出的三种花是按照顺序来的,前50个是第0类,51-100是第1类,101~150是第二类,如果我们分训练集和测试集的时候要把顺序打乱
这里我们引入一个两类shuffle的函数,它接收两个参数,分别是x和y,然后把x,y绑在一起shuffle.
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
下面我们导入Iris数据并打乱它,然后分为100个训练集和50个测试集
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
2. 试验各种不同的方法
常用的分类方法一般有决策树, SVM, kNN, 朴素贝叶斯, 集成方法有随机森林,Adaboost和GBDT
完整代码如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
给出的结果如下:
阅读全文
0 0
- 转:30分钟学会用scikit-learn的基本分类方法(决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
- 30分钟学会用scikit-learn的基本分类方法(决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
- 30分钟学会用scikit-learn的基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
- 30分钟学会用scikit-learn的基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
- Python scikit-learn包 决策树和随机森林实例代码
- 组合分类方法——装袋(bagging);提升(boosting)和AdaBoost;随机森林
- 【机器学习实战】第7章 集成方法 随机森林(RandomForest)和 Adaboost
- Machine Learning with Scikit-Learn and Tensorflow 7 集成学习和随机森林(章节目录)
- 随机森林和GBRT的区别
- 转:Scikit-Learn 随机森林分类器的使用
- 单一决策树与集成模型(随机森林分类器、梯度提升决策树)的比较
- 集成方法(随机森林)
- Scikit-Learn 随机森林分类器的使用
- 使用scikit-learn的随机森林对西瓜进行分类
- 决策树、SVM、AdaBoost方法的比较
- 决策树和随机森林
- 决策树和随机森林
- 决策树和随机森林
- 优秀的用户界面设计技巧
- 调用百度地图开发示例
- get方式地址栏传中文参数乱码 及 form表单利用jquery.serialize()序列化中文参数乱码 解决总结
- MemoryStream类——c#
- 一个简单的人员信息管理程序(虚函数与多态的使用)
- 转:30分钟学会用scikit-learn的基本分类方法(决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
- windows TensorFlow GPU版本的安装|TensorFlow can't cudat80_64.dll
- MVP系列-Android平台-第1讲-初探MVP
- Eureka手把手集群配置
- 权限控制框架
- tx2 faster rcnn 训练自己的数据错误及解决方法
- thinkphp5配置入口路径
- 正则表达式获取一个文本域中每一行的值并且去掉前后空格
- tomcat8.5.24导自己的创建的https证书时,server.xml的配置