p分位函数(四分位数)概念与pandas中的quantile函数
来源:互联网 发布:程氏cms 编辑:程序博客网 时间:2024/04/20 13:54
p分位函数(四分位数)概念与pandas中的quantile函数
函数原型
DataFrame.quantile(q=0.5, axis=0, numeric_only=True, interpolation=’linear’)
参数
- q : float or array-like, default 0.5 (50% quantile 即中位数-第2四分位数)0 <= q <= 1, the quantile(s) to compute- axis : {0, 1, ‘index’, ‘columns’} (default 0)0 or ‘index’ for row-wise, 1 or ‘columns’ for column-wise- interpolation(插值方法) : {‘linear’, ‘lower’, ‘higher’, ‘midpoint’, ‘nearest’}当选中的分为点位于两个数数据点 i and j 之间时: linear: i + (j - i) * fraction, fraction由计算得到的pos的小数部分(可以通过下面一个例子来理解这个fraction); lower: i. higher: j. nearest: i or j whichever is nearest. midpoint: (i + j) / 2.
统计学上的四分为函数
原则上p是可以取0到1之间的任意值的。但是有一个四分位数是p分位数中较为有名的。
所谓四分位数;即把数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
- 第1四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
- 第2四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
- 第3四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
第3四分位数与第1四分位数的差距又称四分位距(InterQuartile Range,IQR)
计算方法与举例
为了更一般化,在计算的过程中,我们考虑p分位。当p=0.25 0.5 0.75 时,就是在计算四分位数。
首先确定p分位数的位置(有两种方法):
方法1 pos = (n+1)*p
方法2 pos = 1+(n-1)*p
pandas 中使用的是方法2确定的。
给定测试数据:
a b0 1 11 2 102 3 1003 4 100
计算
df = pd.DataFrame(np.array([[1, 1], [2, 10], [3, 100], [4, 100]]),columns=['a', 'b'])print(df.quantile(.1))
结果是:
a 1.3b 3.7Name: 0.1, dtype: float64
默认使用的是linear 插值
计算a列
pos = 1 + (4 - 1)*0.1 = 1.3
fraction = 0.3
ret = 1 + (2 - 1) * 0.3 = 1.3
计算b列
pos = 1.3
ret = 1 + (10 - 1) * 0.3 = 3.7
0 0
- p分位函数(四分位数)概念与pandas中的quantile函数
- 分位数(quantile)与分位函数(quantile function)
- 分位数(quantile)
- 基于R语言的分位数回归(quantile regression)
- 随机变量的分布与分位数概念
- 分位数概念
- 四分位数
- spss四分位数
- SAS概率相关函数(密度函数、分布函数、分位数函数、随机数函数)
- 四分位数(定义、位置、数值)
- 四分位数 箱线图
- 中位数与n分位数
- 四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles
- MDX示例:求解中位数、四分位数(median、quartile)
- 分位数
- 4-19 递归计算P函数 (10分)
- c++实现"四分位数"算法1
- c++实现"四分位数"算法2
- oracle培训第五天
- HDU5877-Weak Pair
- Map集合操作及简易底层实现
- js中var, const, let的区别
- Android InputMethod 源码分析,显示输入法流程
- p分位函数(四分位数)概念与pandas中的quantile函数
- windows API入门使用 vs2013
- CodeForces
- CF
- MySQL的常用操作命令详解
- VUE本地开发第三弹:vue-cli+nginx实现本地开发
- K-diff Pairs in an Array问题及解法
- centos搭建gitlab服务器
- 关于上架App Store 的问题汇总