统计学6
来源:互联网 发布:高性能开源网络库 编辑:程序博客网 时间:2024/04/30 09:49
假设检验
统计推断的基本问题可以分为两大类,一类是参数估计问题,另一类是假设检验问题。
精神学家用老鼠测试一种药物的反应时间的效果,已知没有注射药物的老鼠平均反应时间是1.2秒,100只注射了药物的老鼠平均反应时间是1.05秒,样本标准差是0.5秒,你认为药物对反应时间有效果吗?
这里需要建立两个假设,第一个假设是零假设
首先考虑抽样分布,是一个正态分布。假设零假设是正确的,则抽样分布的均值
再想得到1.05秒的概率是多少或者说1.05秒离抽样分布均值
得到距离抽样分布均值有3个标准差远甚至更远的极端情况,概率有多少,1-99.7%=0.3%。
假设零假设是正确的,得到的这种极端情况的概率只有0.3%,因此虽然不是100%确信,也选择备择假设。
很多论文中,得到零假设中这种极端情况的概率称作p值。在这里p值是0.003。p值非常非常小,所以拒绝零假设。通常人们会制定一个门槛,比如门槛设在5%,如果p值小于5%,就拒绝假设。
单侧检验和双侧检验
零假设表示用药前后没有区别,备择假设说明用药有效,不管是增加还是减少反应时间都认为有效,这称作双侧检验。就算很高的反应时间,比如超过3个标准差的响应时间,也会导致拒绝零假设。
类似地,可以进行一个单侧检验。零假设
考虑抽样分布,1.05秒在抽样分布均值
z统计量 vs t统计量
考虑样本均值的抽样分布
z统计量由样本均值统计量推导而出,
但如果样本容量小于30,样本标准差S不是总体标准差
第一型错误
第一型错误是说,拒绝了正确的零假设。一般而言,假设检验从零假设成立出发,那么均值等于某个值,然后有一个z或t统计量来检验零假设是否成立。假设我们的门槛是1%,而样本均值处在0.5%,也就是说零假设成立只有0.5%的几率,p值=0.5%。因为0.5%<1%,所以我们拒绝零假设。
可以理解为,拒绝零假设有0.5%的几率犯第一型错误(实际零假设正确),因为零假设仍有0.5%的几率确实成立。
显著性水平相当于是给事件假设检验中设立一个“门槛”,一般有1%,5%,10%,数值的升高会让犯第一类错误的概率有变动。
小样本假设检验
根据新排放要求,引擎排放均值应低于百万分之20。10台引擎制造出来供测试使用,每台排放水平如下 15.6,16.2,22.5,20.5,16.4,19.4,16.6,17.9,12.7,13.9。问这些数据能否支撑该型引擎满足新标准的结论,假设愿意冒0.01的概率犯第一型错误的风险。
计算出10台引擎的均值
定义零假设
备择假设
假设零假设成立,如果样本均值为17.17的概率小于1%,我们就拒绝零假设。此时得到第一型错误(拒绝正确的零假设)的概率小于1%。
只有10个样本(n= 10),考虑使用t分布和t统计量。
想知道t统计量小于等于-3的概率是否小于1%,t统计量服从标准t分布,我们可以找概率为1%的t统计量是多少,查t表格,得到-2.821,也就是说t值小于-2.821的概率是1%。-3<-2.821,所以拒绝零假设,而且犯第一型错误的概率小于1%。
还是上述的题设,求95%置信区间。
求95%的t值所落区间,考虑t统计量服从标准t分布,查t表格求出临界t值为2.262。
-2.262< t =
所以95%置信区间是
大样本占比假设检验
我们要检验一个假设,即超过30%的美国家庭拥有互联网,显著性水平5%。采集了150个家庭作为样本,结果57家有互联网。
定义零假设:检验不正确,
定义备择假设:
这里要求的是样本占比达到
假设零假设是正确的,总体均值
任意多次取得150容量的样本,其接入互联网的样本占比可以得到二项分布,如果样本数量很多,达到np>5,则可以近似为正态分布(中心极限定理)。此正态分布的样本占比均值
z=
- 统计学6
- 统计学
- 统计学
- 统计学
- 统计学
- 用Python学习统计学基础-6
- 综合评价书籍6:应用统计学等
- #统计学#统计学经典书目
- MLaPP Chapter 6 Frequentist statistics 频率学派统计学
- 统计学学习笔记——(6)概率分布
- 统计学简史
- 统计学悖论
- 统计学基本知识
- 统计学笔记
- 统计学书籍
- 统计学名词解释
- #统计学# 笔记
- 统计学概要
- 5年内Hadoop大数据分析市场产值将超500亿美元
- 一起学WEB(八) 一个网页练习(二)
- linux设备驱动归纳总结(五):2.操作硬件——IO内存
- 移动语义(move semantic)和完美转发(perfect forward)
- svn利用post-commit自动部署
- 统计学6
- 验证码识别续
- 如何上传base64图片到七牛云存储,然后返回图片url呢??
- Activity与Fragment的传参
- 125. Valid Palindrome \ 459. Repeated Substring Pattern
- 【GDKOI2017模拟1.21】Rhyme
- android studio签名打包方法
- 一个由进程内存布局异常引起的问题
- 十二、用MapReduce完成类似倒排索引的功能