scikit-learn的基本用法(四)——数据归一化
来源:互联网 发布:u8用友软件介绍 编辑:程序博客网 时间:2024/04/30 12:35
文章作者:Tyan
博客:noahsnail.com | CSDN | 简书
本文主要介绍scikit-learn中的数据预处理之归一化。
- Demo 1
import numpy as npfrom sklearn import preprocessing# 定义arraya = np.array([-10, 2.3, 13.7, 56, 108])print a# 对array进行归一化(normalization)# scale进行的操作是按列减去均值, 除以方差, 因此数据的均值为0, 方差为1print preprocessing.scale(a)
- 结果
[ -10. 2.3 13.7 56. 108. ][-1.01951435 -0.73451375 -0.47036685 0.50975718 1.71463777]
- Demo 2
import numpy as npimport matplotlib.pyplot as pltfrom sklearn import preprocessingfrom sklearn.cross_validation import train_test_splitfrom sklearn.datasets.samples_generator import make_classificationfrom sklearn.svm import SVC# 生成数据集X, y = make_classification(n_samples = 200, n_features = 2, n_redundant = 0, n_informative = 2, random_state = 22, n_clusters_per_class = 1, scale = 100)# 查看数据分布plt.scatter(X[:, 0], X[:, 1], c = y)plt.show()# 数据归一化处理, 不进行处理时注释掉X = preprocessing.scale(X)# 将数据分为训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2)# 构建分类器svm = SVC()# 训练分类器svm.fit(X_train, y_train)# 测试print svm.score(X_test, y_test)
- 结果
# 进行归一化的准确率0.9# 不进行归一化的准确率0.65
备注:由于数据是随机生成的, 结果可能会不同,但进行归一化与不进行归一化的差异是一致的。
0 0
- scikit-learn的基本用法(四)——数据归一化
- scikit-learn的基本用法(二)——数据集的使用
- scikit-learn的基本用法(一)——KNN算法的使用
- scikit-learn的基本用法(三)——model的介绍
- scikit-learn的基本用法(五)——交叉验证1
- scikit-learn的基本用法(六)——交叉验证2
- scikit-learn的基本用法(七)——交叉验证3
- scikit-learn的基本用法(八)——模型保存与加载
- scikit-learn的基本用法——模型保存与加载
- scikit-learn的用法
- scikit-learn的用法
- [Scikit-Learn] - 数据预处理 - 归一化/标准化/正则化
- Scikit-Learn的基本使用
- 0.python:scikit-learn基本用法
- scikit-learn常用的用法及问题
- scikit learn 中pca 的用法
- pandas的基本用法(四)——处理缺失数据
- scikit-learn的4.3对数据预处理
- eclipse中导入Maven工程,包引入路径报错
- 【Android】存储选项详解
- Tinker使用过程及注意点(1)-环境搭建及简单使用
- DeepLab:深度卷积网络,多孔卷积 和全连接条件随机场 的图像语义分割 Semantic Image Segmentation with Deep Convolutional Nets, Atro
- 在hbuilder中利用xdebug helper 断点调试php
- scikit-learn的基本用法(四)——数据归一化
- Java对象初始化顺序
- 线程如何获取另外主动退出的线程的传出指针
- leetcode 491. Increasing Subsequences & lc 78. Subsets
- 【Codeforces 803 A】+ 构造
- 求最近点对
- 教你用webgl快速创建一个小世界
- Java设计模式—观察者模式
- 【软考】后缀式