ESL作业笔记2.5:最小二乘法预测输出的误差期望
来源:互联网 发布:淘宝药品现在要怎么买 编辑:程序博客网 时间:2024/06/07 04:59
本文章基本是对https://stats.stackexchange.com/questions/130998/explanation-of-formula-for-median-closest-point-to-origin-of-n-samples-from-unit 的翻译。
解决问题为Element of Statistical Learning (ESL, https://web.stanford.edu/~hastie/ElemStatLearn/)课后习题2.5.
题目简介
使用最小二乘法可以得到一个线性回归模型,然后使用得到的模型可以得到预测输出,这里面讨论这个预测输出和目标值之间的误差期望。
书中给出了公式却没有推导,作为课后题的形式出现。公式如下:
其中EPE为expected prediction error,期望预测误差的缩写。N为样本数,p为输入维度,
题外话稍微分析一下两个公式,在基于多种假设的情况下,预测误差与输入有关,取决于
x0 与X 的相关程度。一个定性的结论是x0 越接近X 中心,误差期望越小。这个也符合直觉,不同于knn是local method,least square是用训练集的X^TX去近似整个输入域的E(X^TX),类似的还有XY近似整个输入输出域的E(XY),所以这个近似在训练集所在邻域准确性高,误差小。
再看整个输入域的预测误差期望,这个可以近似常说的complexity。这个公式结论的得出是基于N足够大,X的选取足够随机,X的均值为0等强假设的。虽然假设不一定成立,但是得到强假设条件下的结论,有助于对模型进行定性的分析,况且上诉假设中的部分可以通过预处理、控制采样过程等方法近似执行。全域的预测误差期望最终的公式非常简洁,其中δ 为问题原有参数,不可控制,可看到最终期待误差随p增大递增,N增大递减,p和N之间是线性关系(这里就不同于knn的指数关系了,所以对于高维数据有限样本数,least square是要优于knn的)。
公式推导
1. 解最小二乘法
对MSE(mean square error)求导,导数为0的点即为最优解。
这里还有些题外话:得到最优解之后其实可以稍微分析一下最优解的性质。可以看出
Eτβ^=β ,所以在上诉n多假设满足的条件下,最优解的期望是和目标值相同的。而β^ 的协方差为
Cov(β^)======Eτ((XXT)−1Xϵ)(XXT)−1Xϵ)TEτ((XXT)−1XϵϵTXT(XTX)−1)EXEY|X((XXT)−1XϵϵTXT(XTX)−1)EX((XXT)−1XEY|X(epsilonϵT)XT(XTX)−1)EX((XXT)−1Xδ2INXT(XTX)−1)δ2EX((XTX)−1)
所以β^ 的协方差与训练集X 的性质相关。
把求得的最优解带入模型记得
2. EPE(x0 )的求解
首先对公式加减项方便之后做拆分
可看到这里是三项式相加之后平方的期望值,在执行平方操作之前,首先分析分析每个单项的性质。最后将所有得到的性质带入上诉公式,即可推导出题目中的第一个公式。
对于项
对于三项中的前两项都要先求出
最后分析三项中的第一项
综上,将上诉所有性质代入EPE公式中,并对其平方项展开,得到如下结论:
3. 求解Ex0EPE(x0)
这里最重要的方法就是引入了trace,因为
然后利用假设:
代入公式得到:
- ESL作业笔记2.5:最小二乘法预测输出的误差期望
- ESL作业笔记2.1.
- 常用的预测误差计算方法
- ESL作业笔记2.3:均匀分布情况下最近邻距离的中值
- CS231n作业笔记1.5:Softmax的误差以及梯度计算
- CS231n作业笔记1.6:神经网络的误差与梯度计算
- 最小二乘法求仿射变换参数,并剔除误差较大的点
- 高斯分布期望和方差的最小二乘法拟合
- ESL学习笔记
- ESL学习笔记(一)
- ESL学习笔记(二)
- R语言估算不同分类器的预测误差
- 最小二乘法 与 均方误差的区别 哈哈哈 相信很多人都没注意到
- CS231n作业笔记1.3:SVM的误差函数以及反向传播(非向量及向量算法)
- 泛化误差上界的证明,说明机器能进行学习和预测的基本原理。
- 【学习李宏毅ML笔记】作业:预测PM2.5
- 精镗孔尺寸误差预测补偿技术的研究概况与趋势
- 单隐层BP神经元个数对迭代步数和预测误差的影响
- 归并排序算法
- batch normalization 中的 beta 和 gamma参数
- 欧几里得算法&&扩展欧几里得算法
- 对知识图谱的理解报告
- 洛谷 P1799 数列_NOI导刊2010提高(06)
- ESL作业笔记2.5:最小二乘法预测输出的误差期望
- Spring学习笔记(四) --- 装配Bean之通过XML装配
- Ubuntu16.04上启动Spyder出现错误AttributeError: 'module' object has no attribute '_base'
- 实验一线性表的基本操作实现及其应用
- 阿里云ubuntu16.04实测配置【php+mysql+apache】
- Fragment面试总结
- HTTP响应状态码及其含义
- 连续子段和问题(动态规划)
- Android TextView 通过代码设置加粗和取消加粗 等效果无反应或者反应缓慢