方差 残差 离差
来源:互联网 发布:詹姆斯助攻数据统计 编辑:程序博客网 时间:2024/04/29 07:05
1 总平方和(SST)、回归平方和(SSR)与残差平方和(SSE) 得到后,可以把Y分解为可以被解释变量解释的和不能被解释的两部分,
Y = X+=+ (3.31)
定义总平方和(原始值-平均值)
SST = =- 2+T=Y'Y - T (3.32)
其中是yt 的样本平均数,定义为=。定义回归平方和为(回归值-均值)
SSR = ='-T (3.33)
其中的定义同上。残差平方和为(原始值-回归值)
SSE = ==' (3.34)
则有如下关系存在,
SST = SSR + SSE (3.35)
证明:
Y ' Y = (X+)' (X+) =' X 'X+'+ 2'X '.
由 (3.6) 式,有X '=0。代入上式得
Y ' Y =' X 'X+'='+' (3.36)
从上式两侧同减T,得 (3.35) 式。 证毕
SSE(和方差、误差平方和):The sum of squares due to error
MSE(均方差、方差):Mean squared errorRMSE(均方根、标准差):Root mean squared error
R-square(确定系数):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient ofdetermination
下面我对以上几个名词进行详细的解释下,相信能给大家带来一定的帮助!!
一、SSE(和方差)(残差)
该统计参数计算的是拟合数据和原始数据对应点的误差的平方和,计算公式如下
SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗,所以效果一样
二、MSE(均方差)
该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n,和SSE没有太大的区别,计算公式如下
三、RMSE(均方根)
该统计参数,也叫回归系统的拟合标准差,是MSE的平方根,就算公式如下
在这之前,我们所有的误差参数都是基于预测值(y_hat)和原始值(y)之间的误差(即点对点)。从下面开始是所有的误差都是相对原始数据平均值(y_ba)而展开的(即点对全)!!!
四、R-square(确定系数)
在讲确定系数之前,我们需要介绍另外两个参数SSR和SST,因为确定系数就是由它们两个决定的
(1)SSR:Sum of squares of theregression,即预测数据与原始数据均值之差的平方和,公式如下
(2)SST:Total sum of squares,即原始数据和均值之差的平方和,公式如下
细心的网友会发现,SST=SSE+SSR,呵呵只是一个有趣的问题。而我们的“确定系数”是定义为SSR和SST的比值,故
其实“确定系数”是通过数据的变化来表征一个拟合的好坏。由上面的表达式可以知道“确定系数”的正常取值范围为[01],越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好
0 0
- 方差 残差 离差
- 总体,个体,抽样,样本,样本容量,随机变量,期望,方差,离差,残差
- 从Variance说起:回归、聚类、残差和方差
- 均方误差、平方差、方差、均方差、协方差
- 均方误差、平方差、方差、均方差、协方差
- 残差
- 残差
- 残差
- 离差
- 离差
- 方差,协方差,标准差和均值标准差等各种差
- 残差(residual)
- 残差金字塔实现
- 学生化残差
- 深度残差网络
- 深度残差网络
- 残差神经网络
- 残差学习
- 详细讲解vc 6.0进行DDK驱动开发
- 个人开发者的成长之路
- AD域中常见属性名词解释
- nginx 禁止svn目录访问的脚本
- 第十一周项目:存储班长信息的学生类(2)
- 方差 残差 离差
- android httpclient与javaweb服务器通讯
- 第十一周项目一:存储班长信息的学生类(1)
- 缠中说禅学习整理——线段定义及划分(二)
- 第11周项目2 - 职员有薪水了(1)
- C++找出两个数组中不相同的数
- mac 下 python 爬虫工具 scrapy 的安装
- 事务的传播行为
- 黑马程序员——java语言加强部分——反射之构造方法