基于IRIS(鸢尾花)数据集使用sklearn的特征工程练习

来源:互联网 发布:王中磊和女星 知乎 编辑:程序博客网 时间:2024/05/16 11:50

【环境】

Python 

需要载入sklearn


【IRIS数据集】

由Fisher在1936年整理,包含4个特征(Sepal.Length(花萼长度)、Sepal.Width(花萼宽度)、Petal.Length(花瓣长度)、Petal.Width(花瓣宽度)),特征值都为正浮点数,单位为厘米。目标值为鸢尾花的分类(Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),Iris Virginica(维吉尼亚鸢尾))。


【练习步骤】

1. 首先载入IRIS的数据集,此数据集在sklearn内已经储存好。

from sklearn.datasets import load_iris #导入IRIS数据集 iris = load_iris()  #特征矩阵 

其中iris.data 包含了四个特征值,iris.target为目标值。可以打印出来观察。




2. 数据预处理

选择归一化对数据进行无量纲化处理

from sklearn.preprocessing import NormalizerNormalizer().fit_transform(iris.data)




待续



参考网址:

http://mp.weixin.qq.com/s/_RiW7thoshRNbubONCqgPQ

0 0
原创粉丝点击