相关分析第一步:判断变量的总体是否正态分布

来源:互联网 发布:阿里云pc输入法 编辑:程序博客网 时间:2024/04/30 06:03
正态性分布检验

1.观察法
x为你要检验的数据。

hist(x);  %频数直方图(肉眼看是否左右对称,中间多,两边少)

2.观察法
histfit(x);%正态曲线拟合
normplot(x);%正态性检验(离散点是否分布在一条直线上,表明样本来自正态分布,否则是非正态分布)

方法2衍生:{{{以下方法不能检验是否正态分布,ttest函数是用来做方差未知时单个正态总体均值的检验,前提是总体服从正态分布,而不是检验数据是否服从正态分布。normfit函数只是用来求已经知道是正态分布的数据的均值、方差、置信区间用的。
%参数估计 
[muhat,sigmahat,muci,sigmaci]=normfit(x);%muhat均值,sigmahat方差,muci均值的0.95置信区间,sigmaci方差的0.95置信区间
%假设检验(现在在方差未知的情况下,检验均值是否为mahat)
[h,sig,ci]=ttest(x,muhat); %h=0,接受假设,均值=mahat
%其中h为布尔变量,h=0表示不拒绝零假设,说明均值为mahat的假设合理。若h=1则相反;
%ci表示0.95的置信区间。
%sig若比0.5大则不能拒绝零假设,否则相反。}}}

进行参数估计和假设检验时,通常总是假定总体服从正态分布,虽然在许多情况下这个假定是合理的,但是当要以此为前提进行重要的参数估计或假设检验,或者人们对它有较大怀疑的时候,就确有必要对这个假设进行检验,进行总体正态性检验的方法有很多种,以下针对MATLAB统计工具箱中提供的程序,简单介绍几种方法。

3.Jarque-Bera检验

     利用正态分布的偏度g1和峰度g2,构造一个包含g1,g2的分布统计量(自由度n=2),对于显著性水平,当分布统计量小于分布的分位数时,接受H0:总体服从正态分布;否则拒绝H0,即总体不服从正态分布。这个检验适用于大样本,当样本容量n较小时需慎用。
Matlab命令:h =jbtest(x),[h,p,jbstat,cv] =jbtest(x,alpha)。
H0:服从正态N(mu,sigma2)

4.Kolmogorov-Smirnov检验
通过样本的经验分布函数与给定分布函数的比较,推断该样本是否来自给定分布函数的总体。容量n的样本的经验分布函数记为Fn(x),可由样本中小于x的数据所占的比例得到,给定分布函数记为G(x),构造的统计量为,即两个分布函数之差的最大值,对于假设H0:总体服从给定的分布G(x),及给定的,根据Dn的极限分布(n®¥时的分布)确定统计量关于是否接受H0的数量界限。
因为这个检验需要给定G(x),所以当用于正态性检验时只能做标准正态检验,即H0:总体服从标准正态分布。Matlab命令:h =kstest(x)。
H0服从正态N(0,1)

5.Lilliefors检验    它将Kolmogorov-Smirnov检验改进用于一般的正态性检验,即H0:总体服从正态分布,其中由样本均值和方差估计。Matlab命令:h =lillietest(x),[h,p,lstat,cv]=lillietest(x,alpha)。
H0服从N(mu,sigma2)

*说明:
函数 lillietest
格式 H = lillietest(X) %对输入向量X进行Lilliefors测试,显著性水平为0.05.
H = lillietest(X,alpha) %在水平alpha而非5%下施行Lilliefors测试,alpha在0.01和0.2之间.
[H,P,LSTAT,CV] = lillietest(X,alpha) %P为接受假设的概率值,P越接近于0,则可以拒绝是正态分布的原假设;LSTAT为测试统计量的值,CV为是否拒绝原假设的临界值.
说明 H为测试结果,若H=0,则可以认为X是服从正态分布的;若X=1,则可以否定X服从正态分布.
例4-81
>> Y=chi2rnd(10,100,1);
>> [h,p,l,cv]=lillietest(Y)
h =
1
p =
0.0175
l =
0.1062
cv =
0.0886
说明 h=1表示拒绝正态分布的假设;p = 0.0175表示服从正态分布的概率很小;统计量的值l = 0.1062大于接受假设的临界值cv =0.0886,因而拒绝假设(测试水平为5%).
>>hist(Y)
从图中看出,数据Y不服从正态分布.

6.另外还有一种方法:首先对于数据进行标准化:Z = ZSCORE(X),然后在进行2)的Kolmogorov-Smirnov检验,检验是否为标准正态分布,类似于对于方法2)的改进。

另外国标GB-4882中还给出了正态性检验的有方向性检验(偏度检验、峰度检验、多方向检验)、无方向检验(Shapior-Wilk检验,即W检验、Epps-Pully检验)、联合检验法。
0 0
原创粉丝点击