FDR校正的程序实现及严格程度对比

来源:互联网 发布:java反序列化 编辑:程序博客网 时间:2024/05/29 13:46


FDR校正的程序实现及严格程度对比


前言

        做统计分析就离不开P value<0.05,而写过科研文章的人也都知道没有经过FDR校正的P值就像一盘散沙,不用风吹,走两步自个儿就散了。 那么FDR校正这个让人又爱又恨的东西是什么呢?又是如何实现呢?

        原理是这样:设总共有m个候选基因,每个基因对应的p值从小到大排列分别是 p(1),p(2),...,p(m),则若想控制fdr不能超过q(如0.05),则只需找到最大的正整数i,使得 p(i)<= (i*q)/m.然后,挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因,这样就能从统计学上保证fdr不超过q。计算方法参考:http://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html

        没听明白?再说简单点就是对统计分析结果产生的P值做一次筛选,对原始P值<0.05这个显著性的真实性用FDR校正后的新P值做判定。

         下面对FDR校正的程序实现基于MATLAB和R分别进行介绍。


(一) MATLAB实现


mafdr函数


1. FDR = mafdr(PValues);                                                        

%最简单的实现方式,基于Storey procedure ( introduced by Storey, 2002),适用于P值数量>1000的情况,否则原则上会崩溃。我用MATLAB测试过,会出现warning,但不会报错。严格程度较低,如果你的 ttest P值不是特别显著(0.01-0.05),可以用这个试试,或许可以过FDR校正.


2.FDR=mafdr(P,'BHFDR', true);                                              

%基于linear step-up (LSU) procedure (introduced by Benjamini and Hochberg, 1995)。最常见的FDR校正方式,严格程度较高,但比
Bonferroni校正低,适用于 ttest P值显著(<0.01)。


3.FDR=mafdr(P,'Lambda', [0.01:0.01:0.95]);                          

 %指定调整参数λ,用于估计零假设为真的先验概率,Lambda Value可以是:(1)0-1内任意一值  (2)4个以上序列,或以示例的矩阵形式:[first:incr:last],mafdr函数自动选择最优参数。严格程度比1略低,我用第一个不能过校正但是用这个居然可以过,为FDR苦恼得同志们可以被解救了。


4.FDR= mafdr(P, 'Method', MethodValue, [0.01:0.01:0.95]);   

%对选择最优参数lambda的方法进行选择,'bootstrap' (default),'polynomial'。第3种方法的延伸。


(二) R语言实现


p<-c(p1,p2,...,pn)                                                                    %括号内载入P值序列,","间隔

p.adjust(p,method="method value",length(p))                   %通过修改method value变换FDR方法,包"holm","horchberg","hommel","bonferroni","BH","BY","fdr"。从严格程度上"bonferroni"最可怕,"BH","fdr"与MATLAB的1,2相同,其余在之间。


FDR校正的程序实现先说到这里,如果你有其他的方法请在下方留言评论或发邮件与我交流,我的邮箱是liuyuchen0020@163.com

Thanks for your time and best wishes! 


2 0