Khan公开课 - 统计学学习笔记:(十)Chi-square分布
来源:互联网 发布:dbc2000建不了数据库 编辑:程序博客网 时间:2024/05/18 02:43
χ2分布
随机变量X是独立的标准正态分布变量,X~N(0,1),即E(X)=0, Var(X)=1。
Q1=X12,Q1是一个Chi-Square分布,记为,degree of freedom is 1
Q2=X12+ X22,Q2是一个Chi-Square分布,记为 ,degree of freedom is 2
以此类推。图为Chi-Square的分布图。有χ table可供查询,例如P(Q2>2.41) = 0.3
皮尔逊χ2分布检验:Pearson’s chi-squared test
实际观察次数O与某理论次数(E又称期望次数)之差的平方再除以理论次数乃是一个与抽样分布之一的χ2分布非常近似的次数分布。
而自由度则是不相干事件得数目。
如同n足够大是,二项分布和正态分布非常吻合一样,这里也不做理解证明,由法国数学家Pearson给出,就当给了个工具,我们相信工具有效,来使用工具,常用于检查出现频率。
例子1:一维χ2检验
已知从周一到周六,顾客的分布比例为10%、10%、15%、20%、30%、15%,而观察值顾客数为30、14、34、45、57、20,问在significance level α=5%下,这个比例是否正确。
H0:比例正确;H1:比例不正确
自由度是多少,有6个参数,但是自由度是n-1=5,因为只要知道5个,第6个参数是可以计算出来的。查χ表,自由度5的行,α=5%时,χc2=11.07,根据实际观察计算的值比所查值更为极端,所有拒绝给出分布比例H0
例子2:二维列联表χ2检验
检验可能是二维表的方式,例如顾客中又分了男女,由于最后一行和最后一列都可以由其他信息获得,不是独立变量,自由度为(m-1)(n-1)。列联表也成为contingency table。下面例子是某个发病季节检验草药在significance level α=10%是否有效。
根据上面的情况我们进行信息补充:
H0:Herb do nothing; H1: Herbs do something
2行3列,自由度为(2-1)(3-1)=2,查chi table,α=5%时χc2=4.5,所有我们不能拒绝H0,即不能认为草药有作用。
相关链接:我的四方书库
- Khan公开课 - 统计学学习笔记:(十)Chi-square分布
- Khan公开课 - 统计学学习笔记:(四)泊松分布、大数定理
- Khan公开课 - 统计学学习笔记:(七)伯努利分布、置信区间、t分布、p-value和第一型错误
- Khan公开课 - 统计学学习笔记:(五)正态分布
- Khan公开课 - 统计学学习笔记:(十二)逻辑
- Khan公开课 - 统计学学习笔记:(一)中间值和统计图表
- Khan公开课 - 统计学学习笔记:(二)总本、样本、集中趋势、离中趋势
- Khan公开课 - 统计学学习笔记:(三)随机变量、概率密度、二项分布、期望值
- Khan公开课 - 统计学学习笔记:(六)中心极限定理
- Khan公开课 - 统计学学习笔记:(八)样本均值之差
- Khan公开课 - 统计学学习笔记:(九)线性回归公式,决定系数和协方差
- Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计
- Khan公开课 - 概率学习笔记(一)独立事件、相依事件和排列组合
- 机器学习小组知识点21:卡方分布(Chi-Square Distribution)
- 统计学相关(网易公开课笔记)
- 卡方分布(Chi-square Distribution)
- 统计学学习笔记——(6)概率分布
- 统计学学习笔记——(7)抽样分布
- windows下命令行操作
- MySQL数据类型详解
- Windows操作系统下IIS版本对应关系
- js匿名函数和闭包的学习
- SQLServer中实现Oracle多列条件in
- Khan公开课 - 统计学学习笔记:(十)Chi-square分布
- 黑马程序员--02 JAVA语法基础篇
- 软重启
- 超出最大会话数和Ora-00020超出最大进程数错误的解决方法
- Android使用ListView应该注意的地方
- win7+64位+Oracle+11g+64位下使用PLSQL+Developer+的解决办法(转)
- zoj3457解题报告
- 关于计算几何一些算法
- 陕西引汉济渭工地宿舍火灾已致13死24伤-陕西-引汉济渭-火灾