统计学8
来源:互联网 发布:linux安装ipython3 编辑:程序博客网 时间:2024/05/29 15:01
线性回归中的平方误差
假设坐标平面内有n点,想找到一条直线,最小化这些点到该直线的平方误差。我们需要求出m和b的值。
定义下误差的概念
.
.
平方误差
线性回归公式的推导
令y的平方的均值
最小化SE,得到m和b的值。
首先对m求偏导,令
对b求偏导,令
下面将两者都化成mx+b形式,
满足这两个方程的m和b就是最佳拟合直线的m和b。从第二个方程可以看出点
我们可以解方程组以得到m和b,也可以通过直线上的两个点求出直线y=mx+b。
得到m=
线性回归例题
假设有不共线三点(1,2)(2,1)(4,3),求最佳拟合直线。
m=
回归直线是y=mx+b=3/7x+1
决定系数R2
一种对直线拟合程度的估计,表示y的波动程度有多少百分比能被x的波动程度所描述。
y的总波动程度为
每个点到回归直线的平方误差为
如果直线的平方误差SE很小,意味着直线拟合的很好,
从下图可以看出,比起y的均值线(绿色),每个点和回归线(紫色)接近的更好。
协方差和回归线
两个随机变量之间的协方差为
比如,从X和Y中抽取一个样本后,X高于其期望值,Y低于其期望值,(X-E(X))(Y-E(Y))会得到负数。如果
将协方差的定义,同最小二乘回归联系起来。协方差这个概念很大程度就是从回归中来的。
=E[XY-XE(Y)-E(X)Y+E(X)E(Y)]
=E(XY)-E[XE(Y)]-E[E(X)Y]+E(X)E(Y)
=E(XY)-E(X)E(Y)-E(X)E(Y)+E(X)E(Y)
=E(XY)-E(X)E(Y)
期望值可以看作已知的常数,期望值的期望就是该期望值,即E(E(X))=E(X)。
如果知道这些变量的概率分布或者密度函数,我们就能算出期望值来。但是如果只有样本,则只能用样本估计。E(XY)
m=
因此,回归直线的斜率可以考虑为m=
- 统计学8
- 统计学
- 统计学
- 统计学
- 统计学
- 《统计学》读书笔记第8-10章
- #统计学#统计学经典书目
- 统计学学习笔记——(8)估计
- 统计学简史
- 统计学悖论
- 统计学基本知识
- 统计学笔记
- 统计学书籍
- 统计学名词解释
- #统计学# 笔记
- 统计学概要
- 顺序统计学
- 统计学知识
- 批处理打开多个应用程序
- 关于ListView中控件点击事件与Item点击事件冲突的问题
- 229. Majority Element II
- Oracle—操作表空间
- lua5.1学习笔记(二)
- 统计学8
- ahk常用 调试测试
- 注解相关
- Madifest文件详解
- BZOJ 1029, 建筑抢修
- 深搜的代码
- 傻瓜学java(1)——java基本语法入门
- 【Java】转发与重定向
- Scala 函数式编程进阶 2 更详 代码说明