资料特征数的计算

来源:互联网 发布:阿里云8折推荐码 编辑:程序博客网 时间:2024/05/17 20:22

变量的分布具有两个明显的特征:集中性和离散型。为了反映变量分布的这两个基本性质,必须计算它们的特征数。反映集中性的特征数是平均数,其中应用最普遍的是算术平均数。反映离散性的特征数为变异数,其中最为常用的是标准差,它是变量的变异程度的度量。

算术平均数
对于一个具有N个观测值的有限总体,其观测值为x1x2x3xN,则该总体算术平均数为

μ=x1+x2++xNN=1NN1xi

对于具有n个观测值的x1x2xn的样本,其样本算术平均数为

x=x1+x2++xnn=1nn1xi

xμ的估计值。

标准差

样本标准差为 s=(xx)2n1

总体标准差为 σ=(xμ)2N

样本标准差以及样本方差不用n作为除数,而用n-1作为除数,可以从数学上得以证明,也可以这样理解:有n个样本,它们都可以自由变化,由于有一个已用于估计总体均值,所以还有n-1个可自由变化。(xx)2是最小平方和,如果以n为除数,则所得s2σ2

2 0
原创粉丝点击