最小角回归(Least Angle Regression)
来源:互联网 发布:mysql数据库的安装步骤 编辑:程序博客网 时间:2024/05/29 04:33
最小角回归和其他方法的比较
逐步选择(forward selection)算法(例如forward stepwise regression)在进行子集选择的时候可能会显得太具有“侵略性”(aggressive),因为每次在选择一个变量后都要重新拟和模型,比如我们第一步选择了一个变量
Forward Stagewise是一种比起上面的逐步选择方法更谨慎的方法,但是可能要经过很多步才能到达最后的模型。具体来说,算法每次在变量的solution path上前进一小步,而forward stepwise regression每次都前进一大步。这样一来,Forward Stagewise可以避免漏掉某些重要的和响应相关的变量,但也带来了高昂的计算代价。
Forwad Stagewise有着和Lasso很大的相似性,下图是二者的参数估计,其中 stepwise每次都进行6000步。可以看到,尽管二者的定义看起来完全不同,但是却有着相似的结果。
Forward Stagewise和Lasso都可以看做是最小角回归(Least Angle Regression)的变体,事实上缩写LARS中的s就暗示着Lasso和stagewise。
最小角回归(Least Angle Regression)算法加速了计算过程,只需m步(m是自变量的个数)得到参数的估计值。
算法描述
首先简单的描述一下最小角回归,算法从所有系数都为零开始(X标准化,Y中心化),首先找到和响应y最相关的预测变量
然后重复这个过程,LARS保证了所有入选回归模型的变量在solution path上前进的时候,与当前残差的相关系数都是一样的。
下面是考虑只有两个变量的情景:
记
所以
可以看到,在只有两个变量的情况下,当前的残差(1)只与
因为
LARS算法更新当前拟合值,
注意到这里如果是stagewise算法,那么
定义
因为这里只有两个变量,所以我们选择
如果这里不止两个变量,那么我们还是要像上一步一样选择一个较小的值,使得当前集合中变量的相关度与下一个方向的相关度相等。
上图中的蓝色阶梯型前进路线是stagewise所采取的方案。
现在考虑如何选取
我们假设自变量
在这里
在这里,可以得到一个使得集合中所有向量相关度相等的向量,
即
这是因为
其中
可以看到似乎我们可以有很多
其中
这样看来,我们上面得到的
将
下面形式化的描述一下这个过程:
令
那么
其中
是使得角度相等的单位向量,即
现在考虑选取合适的
当前相关度为
当前活跃集合
让
我们按照上面说讲的公式
在LARS算法要更新拟合值,也就是
我们希望找到下一个相关度绝对值相等的向量
即对任意的
这里假设
所以
进一步推导出
得到
所以我们可以得到
这里
LARS和OLS的联系和区别
在LARS的每一步中(除了最后一步),当前拟合值都向ols的估计值
在LARS的最后一步中,当前活跃集合中包括了所有的自变量,所以步长是任意的,LARS最后一步使得拟合值和OLS的估计值相等。
LARS算法具有较低的计算复杂度,m步的计算开销和OLS的解是同阶的
- 最小角回归(Least Angle Regression)
- 最小角回归(Least Angle Regression)
- 6.最小角回归(Least Angle Regression)
- 最小角回归(least angle regression) 的一点记录
- 机器学习方法:回归(三):最小角回归Least Angle Regression(LARS),forward stagewise selection
- 机器学习方法:回归(三):最小角回归Least Angle Regression(LARS),forward stagewise selection
- 机器学习方法:回归(三):最小角回归Least Angle Regression(LARS),forward stagewise selection
- LAR(最小角回归)
- Least Angle Regression
- Least Angle Regression
- 最小角回归笔记
- 分组最小角回归算法(group LARS)
- 偏最小二乘法回归(Partial Least Squares Regression)
- 偏最小二乘法回归(Partial Least Squares Regression)
- 偏最小二乘法回归(Partial Least Squares Regression)
- 偏最小二乘法回归(Partial Least Squares Regression)
- 偏最小二乘法回归(Partial Least Squares Regression)
- Ridge回归、Lasso回归、坐标下降法、最小角回归
- ios developer tiny share-20160818
- java synchronized详解
- uibutton设置网络图片
- cd `dirname $0`
- android studio 使用Picasso第三方库的方法
- 最小角回归(Least Angle Regression)
- php 生成数据库字典
- 天气险助阵,天气通能否突破行业变现瓶颈?
- TBS腾讯浏览服务的SDK接入
- UML统一建模语言初学
- android布局中使用include及需注意点
- shell文件包含
- 【易语言界面开发系列教程之(EX_UI使用系列教程(11)--EX组件(单选框和复选框))】
- Spring的生命周期