p-value解析

来源:互联网 发布:mac 蓝光播放器 编辑:程序博客网 时间:2024/05/21 08:05

1 . P-value假定值、假设机率假设检验是推断统计中的一项重要内容,是用于判断原始假设是否正确的重要证据。

2 . 用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P 值方法( P-Value,Probability,Pr),这是由于它更容易应用于计算机软件中

3 . 统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为显著, P <0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或     0.01。实际上,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。P < 0.01 时样本间的差异比P < 0.05 时更大,这种说法是错误的。统计结     果中显示Pr > F,也可写成Pr( >F),P = P{ F0.05 > F}或P = P{ F0.01 > F}。

4 . P值的意义

(1) P值一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
(2) 拒绝原假设的最小显著性水平。
(3) 观察到的(实例的) 显著性水平。
(4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
注意:
P值不是给定样本结果时原假设为真的概率,而是给定原假设为真时样本结果出现的概率。
5 . P值的计算
一般地,用X 表示检验的统计量,当H0 为真时,可由样本数据计算出该统计量的值C ,根据检验统计量X 的具体分布,可求出P 值。
具体地说:左侧检验的P 值为检验统计量X 小于样本统计值C 的概率,即: P = P{ X < C}。右侧检验的P 值为检验统计量X 大于样本统计值C 的概率: P = P{ X > C}。双侧检验的P 值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍: P = 2P{ X > C} (当C 位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。
若X 服从正态分布和t 分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。
计算出P 值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:如果α > P 值,则在显著性水平α下拒绝原假设。如果α ≤ P 值,则在显著性水平α下接受原假设。在实践中,当α = P 值时,也即统计量的值C 刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。

6.为什么一个小的p-value要比大的p-value值要更有意义

(1)pvalue的定义:在原假设正确的情况下,出现当前情况或者更加极端情况的概率。
         所 以的小的pvalue说明一件事:不是小概率事件发生了,就是你的原假设是错的。
(2)比如 一个生产厂家专门生产一种重量为50g的砝码。结果生产了一批,最后用统计方    法测得均值47.6标准差20,算出pvalue只有3%,意味着可能是小概率事件发生,比如机器有小故障,技术人员玩忽职守,昼夜温差大影响生产人员心情,但以上情况发生的概率只有区区0.03;或者你这个生产厂家压根儿就不是生产50g的砝码。
(3)p-value越小,confidence interval越大。以双侧检验为例,如果p-value = 2.5%,则置信区间(confidence interval) = 95%,如果p-value = 1%,则confidnece interval = 98%。在假设检验中,confidence interval越大,说明检验结果准确性越高。


0 0