简单线性回归

来源:互联网 发布:java.nio.file.files 编辑:程序博客网 时间:2024/05/17 06:13
回归分析:用来建立方程模拟两个或以上变量之间如何关联
简单线性回归:
1、包含一个自变量X和一个y因变量Y
2、两个变量可以用一条直线模拟出来(多个变量叫做多元线性回归)
一、统计量:描述数据特征
1、均值(mean):

2、中位数(median):数据顺序排列,居于中间位置的变量
3、众数(mode):数据中出现次数最多的数
二、离散程度衡量
1、方差(variance):

2、标准差(standard deviation):

三、简单线性回归模型:

关于偏差ε的假定
    1 是一个随机的变量,均值为0
    2 ε的方差(variance)对于所有的自变量x是一样的
    3 ε的值是独立的
    4 ε满足正态分布
3.1 简单线性回归方程:E(Y)=β0+β1*X
这个方程对应的图像是一条直线,称作回归线
其中{ β0是回归线的截距,β1是回归线的斜率  ,E(y)是在一个给定x值下y的期望值(均值)}
3.2、估计的简单线性回归方程
          ŷ=b0+b1
 这个方程叫做估计线性方程(estimated regression line)
 其中{b0是估计线性方程的纵截距,b1是估计线性方程的斜率,ŷ是在自变量x等于一个给定值的时候,y的估计值 }
3.3、如何练处适合简单线性回归模型的最佳回归线

只要使sum of squares最小就可以了:

求估值方程的b1:

求估值方程的b0:


0 0