z-score
来源:互联网 发布:linux gcc编译命令 编辑:程序博客网 时间:2024/04/30 09:34
最近处理数据时,经常用到Z-score处理方法,所以把自己了解到的知识汇集在此,对自己也是个提升,希望对别人也有所帮助。
(1)Z-score定义
由于Z-score的数据分布满足“正态分布”(N(0,1)),而“正态分布”又被称为“Z-分布”,所以该方法被称为“Z-score”。
Z-score是用于做数据规范化处理的一种方法。
Z-score又称:零-均值规范化、standardscore、Z-value。
(2)Z-score公式
Z-score的计算公式如下:
(注:本图转载自wikipedia)
其中x是原始数据,u是全部数据的均值,分母为标准方差。
(3)Z-score分布
Z-score的分布如下图所示:
(注:本图转载自wikipedia)
(4)Z-score物理意义
Z-score表示原始数据偏离均值的距离长短,而该距离度量的标准是标准方差。
Z-score大于零表示该数据大于均值。
Z-score小于零表示该数据小于均值。
Z-score等于零表示该数据等于均值。
Z-score等于“1”表示该数据比均值大一个标准方差。
Z-score等于“-1”表示该数据比均值小一个标准方差。
如果统计数据量足够多,Z-score数据分布满足,68%的数据分布在“-1”与“1”之间,95%的数据分布在“-2”与“2”之间,99%的数据分布在“-3”与“3之间”。可以通过此对你的数据做一定的验证。相见上面的Z-score数据分布图。
(5)Z-score应用
Z-score可用于数据分布过于凌乱,无法判断最大值与最小值,或者数据中存在过多的奇异点,可以用Z-score方法对数据做规范化处理。
其实Z-score也是一种数据归一化处理的一种方法。
转自:http://blog.sina.com.cn/s/blog_a89e19440101eeuo.html
本文参考如下链接:
http://en.wikipedia.org/wiki/Standard_score
http://stattrek.com/statistics/dictionary.aspx?definition=z_score
- z-score
- z-score
- Z-score模型
- 分位数(quantiles)、Z-score 与 F-score
- 数据预处理-归一化与z-score标准化
- 数据归一化与z-score标准化
- 数据标准化方法z-score讲解(matlab)
- z分数(z-score)——之前世今生
- Fisher r-z变换,z-score标准化与常用标准化
- 方差/标准差/四分位数/z-score公式
- 1,标准差的计算 2,标准分数z-score
- 费舍尔方法 续:逆高斯法(Stouffer's Z-score method)
- 果蝇优化算法优化Z-SCORE模型参数
- R + python︱数据规范化、归一化、Z-Score
- 本题中的变量(不包括变量ID)进行z-score标准化
- Score
- score
- score
- Android Touch分发事件
- 1441*561
- ArcGIS教程:基于ArcGIS提取DEM剖面
- Android 中SharedPreferences详解
- java+内存分配及变量存储位置的区别
- z-score
- 安装Setup.exe 的时候提示 安装失败 2503
- magento megatron主题添加中文
- get提交和post提交的区别
- SQLSERVER中条件表达式和逻辑运算符
- 记录12--Nfs服务器的配置
- Android开发之assets目录与raw目录
- x86_64 xercexc: error: cast from 'const void*' to 'long int' loses precision [-fpermissive]
- 项目管理师-系统分析师-系统架构师的区别