python基础知识——数组拼接(以iris数据为例……)
来源:互联网 发布:淘宝上的小样是真是假? 编辑:程序博客网 时间:2024/06/02 01:31
未辞职前,就在看决策树的一些知识,只不过没有完全地过一遍。现在辞职了有大把的时间,就以决策树知识开始记录吧。
背景:
我在看《集体智慧编程》第七章. 决策树建模 ,想到用iris数据集去试下书里的 treepredict.py。
因为treepredict.py里,my_data是列表形式,包含了目标属性列;
而sklearn里的iris.data 只包含了4列特征数据,目标属性列的数据存放在iris.target里。
现在,是想把iris数据集也加上目标属性列。
具体python代码如下:
#导入数据集iris
from sklearn.datasets import load_iris
#载入鸢尾花数据集
iris=load_iris()
Xdata = iris.data # 待划分的样本特征(4列)
Ydata = iris.target # 待划分的样本的目标属性(最后那列)
#……现在,想将Xdata随机划分出训练集和测试集(测试集占比25%)
from sklearn.cross_validation import train_test_split
#如果一行太长不够写,可以在后面 加个反斜杠,然后enter换行继续写。
#下面这个函数train_test_split(),有4个参数,意思分别是:待划分的样本特征、待划分的样本的目标属性、测试集占比、随机数种子。
X_train,X_test,Y_train,Y_test = train_test_split \
(Xdata,Ydata,test_size=0.25,random_state=30)
阅读全文
0 0
- python基础知识——数组拼接(以iris数据为例……)
- Java实现LSTM和GRU做分类(以IRIS数据集为例)
- R语言实现分层抽样(Stratified Sampling)以iris数据集为例
- sklern使用之通用模版(以iris为数据集,knn,PCA)
- python iris 数据集
- QlikView+R(以iris数据作为案例)(一)
- python——两个数组进行拼接
- python 实现 knn分类算法 (Iris 数据集)
- Python拉勾爬虫——以深圳地区数据分析师为例
- Python拉勾爬虫——以深圳地区数据分析师为例
- Python拉勾爬虫——以深圳地区数据分析师为例
- 三种利用Python批量处理地理数据的方法——以栅格数据投影转换为例
- 大数据入门——Iris数据集类别预测(K近邻分类器:KNN)
- 用数据可视化直观理解数据--iris数据集为例
- 用数据可视化直观理解数据--iris数据集为例
- KD树——UCI数据集IRIS
- 朴素贝叶斯——UCI数据集IRIS
- 【干货】iData二次开发——以脚本语言Python为例
- POJ2584 T-Shirt Gumbo【二分图多重匹配】
- java.lang.NoSuchMethodError: No virtual method checkSelfPermission,可是这个方法存在
- ubuntu 16.04 SVN服务器搭建与windows客户端连接
- 圣杯布局和双飞翼布局
- nginx 更改配置client_max_body_size没有生效 nginx.conf 修改默认限制上传附件大小
- python基础知识——数组拼接(以iris数据为例……)
- AOP--Aspect Oriented Programming
- 1006. 换个格式输出整数 (15)用时9min一次通过
- Bootstrap 模态框(Modal)插件
- 接入sdk 采用aar jar 插件方式踩坑
- Chrome Extension notifications【谷歌浏览器扩展之弹窗通知】
- CTF web题总结--LFI
- static与extern
- 分享一个我的android红白机