机器学习LR模型,在面试中经常被问到的问题
来源:互联网 发布:淘宝网显示不正常 编辑:程序博客网 时间:2024/06/03 23:39
面试机器学习岗位或者算法岗位,经常会被问到一些机器学习算法,其中还有很多细节性的知识。在面试中接触到的LR模型是最多的,为什么?大概原因是LR在公司中用的比较多,这时你可能会问了,这个算法不是很简单吗,性能一般是比不上集成学习算法的。对的,确实是这样,但是公司做应用时不仅仅需要考虑性能,还得考虑效率,简单高效很重要。
1.之前听其他面试者说,遇到过写LR中损失函数的推导,也就是从概率一般式 开始,运用似然函数求解概率最大(被问到:为什么可以用似然函数。答:因为目标是要让预测为正的的概率最大,且预测为负的概率也最大,即每一个样本预测都要得到最大的概率,将所有的样本预测后的概率进行相乘都最大,这就能到似然函数了。)即:
然后取对数:再乘以负的m分之一,就得到了损失函数。
2.逻辑回归为什么一般性能差?LR是线性的,不能得到非线性关系,实际问题并不完全能用线性关系就能拟合。
3.使用L1L2正则化,为什么可以降低模型的复杂度?模型越复杂,越容易过拟合,这大家都知道,加上L1正则化给了模型的拉普拉斯先验,加上L2正则化给了模型的高斯先验。从参数的角度来看,L1得到稀疏解,去掉一部分特征降低模型复杂度。L2得到较小的参数,如果参数很大,样本稍微变动一点,值就有很大偏差,这当然不是我们想看到的,相当于降低每个特征的权重。
4.那么为什么L1能得到稀疏解呢?L1正则化是L1范数而来,投到坐标图里面,是棱型的,最优解在坐标轴上取到,所以某些部分的特征的系数就为0。
5.L1正则化不可导,怎么求解?坐标轴下降法(按照每个坐标轴一个个使其收敛),最小角回归(是一个逐步的过程,每一步都选择一个相关性很大的特征,总的运算步数只和特征的数目有关,和训练集的大小无关)
6.。。。。
以上都是个人的理解,有误请指出。
- 机器学习LR模型,在面试中经常被问到的问题
- 机器学习岗位面试问题汇总 之 线性回归和LR模型
- BI面试中经常被问到的问题
- 面试中经常被问到的问题
- UML面试中经常会问到的问题
- 面试中经常问到的问题
- Android面试中经常遇到的问题
- 机器学习系列--关于LR的两个问题
- WinCE面试经常被问到的问题
- WinCE面试经常被问到的问题
- IOS面试经常被问到的问题
- 面试中经常被问到的单例类
- opencv 机器学习中模型存储问题
- 在项目中经常遇到的问题
- java面试中经常会被问到的一些算法的问题
- java面试中经常会被问到的一些算法的问题
- 嵌入式软件面试中经常问到的问题~。。~
- Java web中面试经常问到的问题
- HDU-2516-取石子游戏-斐波那契博弈
- [poj1061][数论]青蛙的约会
- python中从外部读入数据并进行相应转换
- Git常用命令总结
- 学习笔记-Java swing
- 机器学习LR模型,在面试中经常被问到的问题
- Fiddler域名重定向设置
- 【HDU 1029】Ignatius and the Princess IV (动态规划)
- 大规模时间序列数据自动异常检测架构
- Lua和C++的交互
- 就
- java内存模型详解(JMM)
- 2705: [SDOI2012]Longge的问题 欧拉函数
- AJAX学习