数据分布未明确时的检验方法
来源:互联网 发布:2008 科比 知乎 编辑:程序博客网 时间:2024/05/29 17:24
通常,数据有一个比较明确的分布方式,如二项分布、正态分布等,也就存在针对具体分布方式的明确检验方法。
下面这些检验方式是在数据没有明确的分布方式的情况下使用的,相比有针对明确分布数据集的检验方式,效率更低,需要的样本量更大,更粗糙。一个数据集可以使用多种方式检验零假设,但只要有一种检验方式拒绝零假设,那就可以判定拒绝零假设。
符号检验
也叫sign test。在这篇文章中提到的身高的例子,在这里我们并不假设身高数据有任何分布形式。计算出样本中各数据与中位数的差值正负符号,然后用二项分布来检验假设。
质检部门抽检西洋参,厂商标明重量为100g,以下是抽取25包的称重结果。
res<-c(99.05,100.25,102.56,99.15,104.89,101.86,96.37,96.79,99.37,96.90,93.94,92.97,108.28,96.86,93.94,98.27,98.36,100.81,92.99,103.72,90.66,98.24,97.87,99.21,101.79)//样本中位数为98.36,我们怀疑中位数小于100。下面使用符号检验来检验该假设。//根据厂商标明的重量,可知总体中位数100。计算总体中位数100的情况下,该样本情况的出现概率。pbinom(sum(res>100),length(res),0.5)//p值为0.05387607,高于显著水平,无法确认我们的假设成立。
Wilcoxon符号秩检验
假设上述抽检数据基于中位数呈对称分布,下面使用Wilcoxon检验我们上面的假设。Wilcoxon把样本中位数左右的数据分别与样本中位数相减,并各自按差值的绝对值大小排序,得到秩。比较两边秩之和的大小,如果差距较大,则说明预估的中位数有问题。
//同样假设西洋参的重量中位数小于官方标明的100g,下面进行检验。wilcox.test(res,m=100,alternative = "less")//输出p值为:0.04763,小于显著水平0.05,可以拒绝零假设,从而确认我们的假设成立。//如果要比较两种西洋参的重量,可以分别抽样,然后使用Wilcoxon检验两个样本的中位数wilcox.test(res1,res2,alternative = "less")
游程检验
对于下面这样一组数据,检验一下0和1的出现是否随机。
data<-c(0,1,0,0,1,1,1,0,1,0,1,1,0,0,0,1);runs.test(factor(data));//R package安装失败,无法给出结果。如果p值小于显著水平0.05,可以判定0和1是随机出现,否则不能判定。
0 0
- 数据分布未明确时的检验方法
- 分布的拟合和检验
- SPSS 分布类型的检验
- Matlab中的数据分布KS检验
- 未明确定义列的错误
- Oracle 未明确定义列的错误
- matlab对数据分布检验代码:正态分布,γ分布,泊松分布,指数分布,rayleigh分布
- 基于Wishart分布的Bayesian检验
- 对数据分布进行可视化的方法
- 对数据分布进行可视化的方法
- 指针定义时未明确内存区域导致的内存溢出
- SQL基础:Oracle00-918:未明确定义列的错误
- Oracle00-918:未明确定义列的错误
- SQL基础:Oracle00-918:未明确定义列的错误
- 实现定义、未明确和无定义行为的区别
- “未明确定义列” ibatis的sqlMap中报该
- Oracle00-918:未明确定义列的错误
- 关于web项目报"未明确定义列”的问题
- 白盒测试之圈复杂度,以及可以直接降低圈复杂度的10种重构技术
- UVa1347/poj2677 - C - Tour(DP)
- Jtopo入门Demo
- TrueCrypt最好用的加密软件
- 面向对象程序设计上机练习六(类和对象)
- 数据分布未明确时的检验方法
- UVA10420 - List of Conquests
- javascript时间戳和日期字符串相互转换(json)
- MAC DMG 安装 image not recognized
- flask关于请求方法
- 初学者笔记
- 读模式与写模式
- 【C语言】比较两个数组中是否有相同的元素
- 64位ubuntu kylin 16.04下制作tiny4412可用的SD启动卡