基于python包scikit-learn的数据预处理方法
来源:互联网 发布:网络黄金黄金裴蕾 编辑:程序博客网 时间:2024/06/09 21:18
1、标准化
数据集的* 标准化 对于在scikit中的大部分机器学习算法来说都是一种 常规要求 * 。
如果单个特征没有或多或少地接近于标准正态分布:* 零均值和单位方差 *的高斯分布,那么它可能并不能在项目中表现出很好的性能。
例如, 许多学习算法中目标函数的基础都是假设所有的特征都是零均值并且具有同一阶数上的方差(比如径向基函数、支持向量机以及L1L2正则化项等)。
如果某个特征的方差比其他特征大几个数量级,那么它就会在学习算法中占据主导位置,导致学习器并不能像我们说期望的那样,从其他特征中学习。
>>> from sklearn import preprocessing>>> import numpy as np>>> X = np.array([[ 1., -1., 2.],... [ 2., 0., 0.],... [ 0., 1., -1.]])>>> X_scaled = preprocessing.scale(X)>>> X_scaled array([[ 0. ..., -1.22..., 1.33...], [ 1.22..., 0. ..., -0.26...], [-1.22..., 1.22..., -1.06...]])
参考:
- 数据预处理;
- scikitleran数据预处理
阅读全文
0 0
- 基于python包scikit-learn的数据预处理方法
- Python下的机器学习工具scikit-learn --数据预处理
- scikit-learn数据预处理
- scikit-learn数据预处理
- 基于Python的机器学习包 scikit-learn
- scikit-learn的4.3对数据预处理
- Python下的机器学习工具scikit-learn(学习笔记3--数据预处理)
- scikit-learn数据预处理fit_transform()与transform()的区别
- scikit-learn数据预处理fit_transform()与transform()的区别(转)
- Python数据挖掘入门与实践(二)——scikit-learn数据的预处理转换器以及流水线
- Scikit-learn:数据预处理Preprocessing data
- 【Scikit-Learn 中文文档】预处理数据
- 【Scikit-Learn 中文文档】预处理数据
- 【Scikit-Learn 中文文档】预处理数据
- 【Scikit-Learn 中文文档】预处理数据
- 【Scikit-Learn 中文文档】预处理数据
- 【Scikit-Learn 中文文档】三十四:预处理数据
- 【Scikit-Learn 中文文档】预处理数据
- 虚幻引擎学习之路:动画模块之基础篇
- RSA公钥、私钥,加密、解密
- putty终端出现Access Denied问题
- vue2.0 popwindow
- 微信公众号之access_token获取与管理
- 基于python包scikit-learn的数据预处理方法
- 收藏了也不看的JavaScript,面向对象程序设计(下)!
- jstl标签引入
- javascript原型对象存在的问题(3)
- linux系统下查看历史命令
- C语言程序设计50例(经典收藏)
- CSS初步1
- 数据结构期末课程大总结
- matlab try...catch...end