统计学学习笔记——(3)集中趋势

来源:互联网 发布:大数据hadoop.pdf 编辑:程序博客网 时间:2024/05/09 05:31

集中趋势(Central Tendency)是指一组数据项某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。

均值,中位数,众数

均值(Mean):也称平均数,它是全部数据的算术平均。均值在统计学中具有重要的地位,是集中趋势的最主要测度值。可以通过数据值的总和除以数据的个数来计算:

x¯=ni=0xin

中位数(Median):是一组数据排序后处于中间位置上的变量值,用Me表示。
设一组数据为x1,x2,...,xn,按从小到大的顺序排序后为x(1),x(2),...,x(n),则中位数为:

Me={x(n+12),n12{x(n2)+x(n2+1)},n

众数(Mode):是一组数据中出现次数最多的变量值,用Mo表示。众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。

不同分布的均值、中位数和众数

对称分布

image.png

Mo<Me<x¯

左偏分布
image.png
Mo<Me<x¯

右偏分布

image.png

Mo<Me<x¯

阅读全文
0 0