linear regression的SAS 结果解读

来源:互联网 发布:东华大学网络教育平台 编辑:程序博客网 时间:2024/06/05 18:43
PROC REG DATA=WORK.SORTTempTableSorted
PLOTS(ONLY)=FITPLOT
;
Linear_Regression_Model: MODEL Oxygen_Consumption= Run_Time
/ SELECTION=NONE
;
RUN;


Analysis of Variance:

n 是总体观察数量,p 回归的参数数量. 

  • Model的自由度:Corrected Degrees of Freedom for Model:   DFM = p - 1 
     
  • Error的自由度:Degrees of Freedom for Error:   DFE = n - p 

 

组间和组内的变异性,为什么组间的是模型解释了的(explained),而组内是模型没有解释的呢?

  • SSM(Sum of Squares for Model)即模型平方和,回归平方和。模型和base line(Y的均值)差值平方和,又称为组间平方和。
  • SSE(Sum of Squares for Error) 即 残差平方和。反映每个样本各观测值的离散状况,又称为组内平方和或误差项平方和

见上一个blog。

  • Mean Squared for Model, MSM 衡量评价模型, MSM = SSM / DFM,DFM是model的自由度
  • 均方误差(Mean Squared for Error, MSE)衡量“平均误差”的一种较方便的方法, 是MSE = SSE / DFE,DFE是Error的自由度。

http://facweb.cs.depaul.edu/sjost/csc423/documents/f-test-reg.htm

F检验:

F检验又叫方差齐性检验,判断两总体方差是否相等,就可以用F

如果H0 为真,F = [(SSM/σ)/DFM]/[(SSE/σ)/DFE] = (SSM/DFM)/(SSE/DFE) = MSM/MSE是自由度为(DFM,DFE)的F分布。

这里F检验中,F分布,为什么是[(SSM/σ)/DFM]/[(SSE/σ)/DFE]???有待进一步了解。

R方:

R2,决定系数,自然越大越好,但没有规定0.1就不可以,也很少见超过0.5R方的高低不是判断模型好坏的很好的依据,主要是看模型总体显著性如何(F检验)。

 

参数估计:

最终可以看出模型为





0 0
原创粉丝点击