python基础知识——数组拼接(以iris数据为例……)

来源:互联网 发布:淘宝上的小样是真是假? 编辑:程序博客网 时间:2024/06/02 01:31




未辞职前,就在看决策树的一些知识,只不过没有完全地过一遍。现在辞职了有大把的时间,就以决策树知识开始记录吧。


背景:

我在看《集体智慧编程》第七章. 决策树建模 ,想到用iris数据集去试下书里的 treepredict.py。

因为treepredict.py里,my_data是列表形式,包含了目标属性列;

而sklearn里的iris.data 只包含了4列特征数据,目标属性列的数据存放在iris.target里。

现在,是想把iris数据集也加上目标属性列。



具体python代码如下:

#导入数据集iris
from sklearn.datasets import load_iris

#载入鸢尾花数据集
iris=load_iris()

Xdata = iris.data  # 待划分的样本特征(4列)
Ydata = iris.target  # 待划分的样本的目标属性(最后那列)


#……现在,想将Xdata随机划分出训练集和测试集(测试集占比25%)
from sklearn.cross_validation import train_test_split

#如果一行太长不够写,可以在后面 加个反斜杠,然后enter换行继续写。
#下面这个函数train_test_split(),有4个参数,意思分别是:待划分的样本特征、待划分的样本的目标属性、测试集占比、随机数种子。
X_train,X_test,Y_train,Y_test = train_test_split \
(Xdata,Ydata,test_size=0.25,random_state=30)













阅读全文
0 0
原创粉丝点击