R语言实施皮尔森卡方检验

来源:互联网 发布:瞻博网络 五百强 编辑:程序博客网 时间:2024/06/05 09:46

说明

检查两个数据集中的类别分量是否不同,在统计中会碰到离散型数据与计数数据,比如性别分男、女,某个问题的态度分为赞成、反对,成绩可分优良差,能力可分高中低。对这类数据的统计处理的假设检验一般用计数数据的统计方法进行非参数检验。
卡方检验主要用于两个方面,一是对总体分布进行拟合性检验,检验观查次数是否与某种理论次数相一致。
二是独立性检验,用于检验两组或者多组资料相互关联还是彼此独立。

操作示例(独立性检验)

#mtcars$am有0,1两个因素表示行,mtcars$gear 有3,4,5三个因素表示列library(stats)data("mtcars)ftable = table(mtcars$am,mtcars$gear)ftable = table(mtcars$am,mtcars$gear)ftable = table(mtcars$am,mtcars$gear)> ftable     3  4  5  0 15  4  0  1  0  8  5
#绘制列联表的马赛克图mosaicplot(ftable,main ="number of forward gears within automatic and manual cars",color = TRUE )

手动档与自动档汽车前轮驱动齿轮的马赛克图

对列联表执行卡方检验,以检测自动档与手动档汽车前驱的齿轮数目是否相同:

chisq.test(ftable)    Pearson's Chi-squared testdata:  ftableX-squared = 20.945, df = 2, p-value = 2.831e-05Warning message:In chisq.test(ftable) : Chi-squared近似算法有可能不准

总结

卡方检验用于发现两个类别变量之间是否存在某种关联,最适用于数组中非成组信息的检验。使用条件:1.数据都为类别数据2.变量包括两个或者两个以上独立数据组。
H0:变量A与变量B相互独立(gear数目相同)
H1:变量A与变量B相互不独(gear数目不相同)
由图知:自动档的gear要小于手动档的gear.p-value<0.05,拒绝H0,接收H1.
样例输出了一个警告信息,此次卡方检验的结果可能不正确,这是因为列联表的个数小于5。

原创粉丝点击