sklearn.preprocessing的部分用法
来源:互联网 发布:知乎社区 编辑:程序博客网 时间:2024/05/22 14:52
类:sklearn.preprocessing.StandardScaler
(copy=True, with_mean=True, with_std=True)
通过减去均值并缩放到单位变量来标准化特征。
公式:(x-mean)/std,mean为均值,std为方差,计算时对每个属性/每列分别进行。结果是对于每个属性/每列的数据服从均值为0,方差为1的分布。
实现方式有两种:
(1)使用sklearn.preprocessing.StandardScaler()类,使用该类可以保存训练数据集的参数(scale_,mean_,var_),然后直接使用其对象转换测试数据集
>>>import numpy as np
>>>from sklearn.preprocessing import preprocessing
>>>scaler=preprocessing.StandardScaler()
>>>iiii=np.array([[1.,-1.,2.],[2.,0.,0.],[0.,1,-1.]])
>>>jjjj=scaler.fit(iiii)
>>>jjjj
StandardScaler(copy=True,with_mean=True,with_std=True)
>>>jjjj.scale_
array([1., 0., 0.333333333])
>>>jjjj.var_array([ 0.66666667, 0.66666667, 1.55555556])>>>jjjj.transform(iiii)array([[ 0. , -1.22474487, 1.33630621], [ 1.22474487, 0. , -0.26726124], [-1.22474487, 1.22474487, -1.06904497]])使用该对象对测试数据进行标准化>>>jjjj.transform([[-1., 1., 0.]])array([[-2.44948974, 1.22474487, -0.26726124]])
(2)使用sklearn.preprocessing.scale()函数,可以直接对给定数据进行标准化
>>>iiii=np.array([[1.,-1.,2.],[2.,0.,0.],[0.,1,-1.]])
>>>jjjj=preprocessing.scale(iiii)
>>>jjjj
array([[ 0. , -1.22474487, 1.33630621], [ 1.22474487, 0. , -0.26726124], [-1.22474487, 1.22474487, -1.06904497]])#处理后,数据的均值和方差
>>>jjjj.mean(axis=0)
array([0. , 0., 0.])
>>>jjjj.std(axis=0)array([1. , 1., 1.])
阅读全文
0 0
- sklearn.preprocessing的部分用法
- sklearn.preprocessing的部分用法
- sklearn.preprocessing.PolynomialFeatures 用法
- sklearn preprocessing
- sklearn-Preprocessing
- sklearn.preprocessing.PolynomialFeatures类的使用
- sklearn.preprocessing.PolynomialFeatures类的使用
- sklearn.preprocessing.PolynomialFeatures类的使用
- Sklearn-preprocessing.PolynomialFeatures
- sklearn.preprocessing.PolynomialFeatures
- sklearn.preprocessing.Binarizer
- sklearn.preprocessing.OneHotEncoder
- sklearn.preprocessing.Imputer
- sklearn.preprocessing.LabelEncoder
- sklearn.preprocessing.Normalizer
- sklearn.preprocessing.LabelBinarizer
- sklearn.preprocessing.MultiLabelBinarizer
- PYTHON-sklearn.preprocessing
- Linux内核|实验七 系统调用实验
- Jquery--动画
- 机器学习实战-朴素贝叶斯
- Linux环境下Redis安装搭建
- Rikka with Subset HDU
- sklearn.preprocessing的部分用法
- 反转单词顺序列
- Ext JS DomHelper操作类
- HDU 1079-Calendar Game
- tensorboard无法显示的原因(在Windows下)
- 自顶向下语法分析原理与设计思想
- 【Gym
- 集训8.21树状数组讲解
- Machine Learning in action --CART --treeExplore.py