统计学6

来源:互联网 发布:高性能开源网络库 编辑:程序博客网 时间:2024/04/30 09:49

假设检验
统计推断的基本问题可以分为两大类,一类是参数估计问题,另一类是假设检验问题。

精神学家用老鼠测试一种药物的反应时间的效果,已知没有注射药物的老鼠平均反应时间是1.2秒,100只注射了药物的老鼠平均反应时间是1.05秒,样本标准差是0.5秒,你认为药物对反应时间有效果吗?

这里需要建立两个假设,第一个假设是零假设H0:药物对反应时间无效果,也就是注射了药物的老鼠平均反应时间μ=1.2秒。第二个是备择假设H1:药物有效果,μ1.2秒。假设零假设是正确的,我们得到这个样本(均值1.05,标准差0.5)的概率是多少,如果该概率非常非常小,就可以认为零假设不对,拒绝零假设,选择备择假设。

首先考虑抽样分布,是一个正态分布。假设零假设是正确的,则抽样分布的均值μx¯将等于总体均值1.2秒,抽样分布标准差σx¯=σ100S100=0.05
再想得到1.05秒的概率是多少或者说1.05秒离抽样分布均值μx¯有多少个标准差远,z=(1.2-1.05)/0.05=3。
得到距离抽样分布均值有3个标准差远甚至更远的极端情况,概率有多少,1-99.7%=0.3%。
假设零假设是正确的,得到的这种极端情况的概率只有0.3%,因此虽然不是100%确信,也选择备择假设。

很多论文中,得到零假设中这种极端情况的概率称作p值。在这里p值是0.003。p值非常非常小,所以拒绝零假设。通常人们会制定一个门槛,比如门槛设在5%,如果p值小于5%,就拒绝假设。

单侧检验和双侧检验
零假设表示用药前后没有区别,备择假设说明用药有效,不管是增加还是减少反应时间都认为有效,这称作双侧检验。就算很高的反应时间,比如超过3个标准差的响应时间,也会导致拒绝零假设。

这里写图片描述

类似地,可以进行一个单侧检验。零假设H0:药物对反应时间无效果,μ=1.2秒。备择假设H1:药物有减少时间效果,μ<1.2秒。
考虑抽样分布,1.05秒在抽样分布均值μx¯左侧3个标准差远。假设零假设是正确的,得到的结果低于1.05秒的概率是0.15%。p值是0.0015,接受备择假设。

z统计量 vs t统计量
考虑样本均值的抽样分布
这里写图片描述
z统计量由样本均值统计量推导而出,z=x¯μx¯σx¯=x¯μx¯σnx¯μx¯Sn(n> 30)。然后我们可以查z表格或者说正态分布表格。可以认为n> 30时,样本均值的抽样分布服从正态分布。z统计量服从标准正态分布N(0,1)。

但如果样本容量小于30,样本标准差S不是总体标准差σ的很好估计,样本均值的抽样分布就服从t分布。t=x¯μx¯Sn(n< 30)。t统计量服从标准t分布,均值是0。此时查t表格。

第一型错误
第一型错误是说,拒绝了正确的零假设。一般而言,假设检验从零假设成立出发,那么均值等于某个值,然后有一个z或t统计量来检验零假设是否成立。假设我们的门槛是1%,而样本均值处在0.5%,也就是说零假设成立只有0.5%的几率,p值=0.5%。因为0.5%<1%,所以我们拒绝零假设。

这里写图片描述

可以理解为,拒绝零假设有0.5%的几率犯第一型错误(实际零假设正确),因为零假设仍有0.5%的几率确实成立。
显著性水平相当于是给事件假设检验中设立一个“门槛”,一般有1%,5%,10%,数值的升高会让犯第一类错误的概率有变动。

小样本假设检验
根据新排放要求,引擎排放均值应低于百万分之20。10台引擎制造出来供测试使用,每台排放水平如下 15.6,16.2,22.5,20.5,16.4,19.4,16.6,17.9,12.7,13.9。问这些数据能否支撑该型引擎满足新标准的结论,假设愿意冒0.01的概率犯第一型错误的风险。

计算出10台引擎的均值X¯=17.17,标准差是S=2.98。
定义零假设H0:刚好不满足标准,μ=20
备择假设H1:满足标准,μ<20
假设零假设成立,如果样本均值为17.17的概率小于1%,我们就拒绝零假设。此时得到第一型错误(拒绝正确的零假设)的概率小于1%。
只有10个样本(n= 10),考虑使用t分布和t统计量。t=17.17202.9810=3
想知道t统计量小于等于-3的概率是否小于1%,t统计量服从标准t分布,我们可以找概率为1%的t统计量是多少,查t表格,得到-2.821,也就是说t值小于-2.821的概率是1%。-3<-2.821,所以拒绝零假设,而且犯第一型错误的概率小于1%。
这里写图片描述

还是上述的题设,求95%置信区间。
求95%的t值所落区间,考虑t统计量服从标准t分布,查t表格求出临界t值为2.262。
这里写图片描述

-2.262< t =17.17μ2.9810 <2.262。

所以95%置信区间是17.17±2.262×2.9810,即19.3>μ>15.04。

大样本占比假设检验
我们要检验一个假设,即超过30%的美国家庭拥有互联网,显著性水平5%。采集了150个家庭作为样本,结果57家有互联网。
定义零假设:检验不正确,p30%
定义备择假设:p>30%
这里要求的是样本占比达到p¯=57/150=0.38的概率,如果低于5%,则拒绝零假设。

假设零假设是正确的,总体均值μ或者总体占比p(伯努利分布中μ=p)使得到p¯=0.38的概率最大,所以零假设是正确的条件下,总体均值=p=0.3,总体标准差=0.30.7。——原分布是伯努利分布

任意多次取得150容量的样本,其接入互联网的样本占比可以得到二项分布,如果样本数量很多,达到np>5,则可以近似为正态分布(中心极限定理)。此正态分布的样本占比均值μp¯等于总体均值0.3,样本占比标准差σp¯=零假设下的总体标准差σ/150=0.30.7150=0.037。——样本占比的抽样分布近似于正态分布

z=p¯μp¯σp¯=0.380.30.037=2.14,这里是单侧检验,查表得右侧尾部概率是5%的z值是1.65,因为2.14>1.65,所以2.14处的概率小于5%,拒绝零假设。根据z=2.14还可以求得p值。

0 0
原创粉丝点击