excel之列联表分析

来源:互联网 发布:2016欧洲杯网络转播 编辑:程序博客网 时间:2024/05/22 17:37

EXCEL中列联表的分析

列联表构造:

1.由两个以上变量交叉分类的频数分布表
2.行变量类别用r,ri表示底i个类别
列变量类别用c,cj表示底j个类别
3.每种组合的观察频数用fij表示
4.一个r行c列的列联表称为r*c列联表
这里写图片描述

观察值分布:
这里写图片描述
百分比分布:
这里写图片描述

期望频数分布:
这里写图片描述

尝试回顾离散型随机变量数学期望:
这里写图片描述

卡方检验:
这里写图片描述

假设检验步骤
这里写图片描述

EXCEL中列联表应用:

真实频数如下:
这里写图片描述

我们需要求期望频数
1.求期望频数:
如何求呢?根据求频数的方法—Eij=行总数*列总数/总个数
有:在B10中写入公式 =B$6*$F3/$F$6即可,其中$约束其后面的元素不变。
结果如下:
这里写图片描述

2.求卡方概率值(即卡方统计量的概率,p值)
这里写图片描述

EXCEL中 公式-统计下有计算卡方的函数,绿色部分分别为录入的真实频数和期望频数数值,
公式如下:=CHISQ.TEST(B3:E5,B10:E12)
红色部分为结果。
3.求卡方统计量
这里写图片描述
由卡方检验公式由
如下计算公式:

     =SUM((B3:E5-B10:E12)^2/B10:E12)

红色区域即为结果
4.假设检验:由上假设检验的步骤有:
-置信度 (r-1)(c-1)=2*3=6
-置信水平:0.01(自己定)
-临界值:=CHISQ.INV.RT(0.01,6)
-检验结果:=IF(B16>B20,"拒绝原假设","接受原假设")
结果如下图:
这里写图片描述