统计量及抽样分布的思考与遐想

来源:互联网 发布:刷票软件 微信安卓 编辑:程序博客网 时间:2024/05/16 06:04

什么是统计量呢?

在于寅的《高等工程数学中》区分了统计量和统计量观测值,在维基百科中,没有区分这一点,茆诗松等编著的《概率论与数理统计教程》中也没有区分这一点,因为大家如果理解,在某些场合我们可以根据上下文来区分它们的真正含义。我们先看看如何区分的理解他。

总体的一个简单随机样本(实际上大家不说也应该知道样本是简单随机的)X_1,X_2,...,X_n,如果样本函数 T(X_1,...,X_n)中不含有任何未知参数,那么这个样本函数T就是统计量,它的值T(x_1,...,x_n)被称为统计量的观测值。 

用大写字母表示每个样品,是因为大写字母在概率中被用来做随机变量,相应的小写字母代表随机变量的取值。这也是为什么统计量的观测值中的变量是小写字母了。 用大写字母是为了表征样品的随机性,用小写字母表示他是一组观测值。有些地方不区分这个,一般都用小写字母来表示样品。这里我们研究的话,最好还是区分一下,因为有些教材不区分,所以这样带来的合理性是的我们偶尔写的有些歧义也不会带来大问题。

比如样本均值就是一个统计量。因为样本具有随机性,所以统计量也具有随机性,所以统计量也具有分布,这种分布就叫抽样分布。


什么是样本均值?

给定总体的一个样本X_1,...,X_n,样本容量是n,这个样本的算术平均值就是样本均值。这里不好写,要是博客能像latex一样就好了,那个可以写出来呀。


几个需要记住的定理,作为应用的人,搞工程么,要多想工程问题,尽可能想数学证明,尽可能知道数学结论。所以罗列数学结论还是有必要的。


1,如果把样本与样本均值的差称为偏差,那么样本的所有偏差之和为0。


2,一个函数f = sum((X_i-c)^2) ,使这个函数值最小的c,就是样本均值。偏差平方和是这个函数的最小值。


3,如果总体服从X服从 N(\mu,\sigma^2) , 那么样本均值这个统计量的抽样分布是 N(\mu, \sigma^2/n)


4,如果总体分布不知道,或者知道分布,但不是正态分布。这个分布的数学期望是\mu,方差是\sigma^2,样本均值的渐进分布为N(\mu,\sigma^2/n). 


这四个性质要知道证明才行。第四个性质需要中心极限定理。

以后再介绍那几个定理吧,今天想的多了,休息下。



原创粉丝点击