logistic回归
来源:互联网 发布:数据分析报告的结构 编辑:程序博客网 时间:2024/05/13 05:03
模型知识点:logistic详解,logistic与softmax 与 Lasso regression 与 ridge regression , L0、L1、L2范式 。
一,logistic回归
通常目标标签数据都是以概率的形式给出,而概率p的取值在0到1之间,
因此直接把概率
因此人们通常用p的某个函数f(p)来与x之间建立函数关系,即
几率(odds):一个事件的几率,是指该时间发生于不发生的概率比值,若事件发生为p,那么事件发生的几率就是
对数几率(log odds或logit):对数几率就是
所以logistic回归就是在目标标签的对数几率和特征之间建立线性关系的模型,即
分类问题中为什么logistic比线性回归好:
线性回归用于分类,y = z(x) = α + βx。
这主要是由于线性回归在整个实数域内敏感度一致,每个样本考虑的权重一样,每个样本对回归线的都有相同的影响。而逻辑回归在z(x) = 0时,十分敏感,在z(x) >> 0或z(x) << 0处,都不敏感,更在意z(x) = 0附近的数据是否被正确分类,z(x) = 0附近的数据对模型参数的影响更大,因为逻辑回归把z(x) >> 0或z(x) << 0处的数据都压缩在一起,对于p来说,它们的差异很小。线性回归更多的是找数据拟合线,而logistic找的是数据分割线。下图是logistic的密度函数和分布函数:
最后加一点,logistic模型的MLE估计和log对数损失函数估计是等价的。
二,softmax
Logistic回归模型是softmax的特殊形式。Softmax是n分类模型,其中每一类的概率计算如下:
总共需要训练
容易得到当n=2时,得到
令
令
三,Lasso regression 和 ridge regression 和 L0,L1,L2范式
Logistic回归模型的目标函数为:
这样直接优化求参,容易出现过拟合现象,所以经常会给目标函数加一些正则项来防止过拟合,即修改后的目标函数:
通常的正则项有
Lasso regression是指目标函数中加入
Ridge regression是指目标函数中加入
参考:
http://blog.csdn.net/xbinworld/article/details/44276389
http://blog.csdn.net/cyh_24/article/details/50359055
https://wenku.baidu.com/view/1e69ea0a2f60ddccda38a067.html
之后添加(MaxEnt(Max Entropy)GLM广义线性模型,总结下logistic的decision boundary)(其实二分类问题,就是大于某个值就是正类,否则是负类。如果是x+y<10,那么分界线就是直线,如果x^2+y^2<10,那么分界线就是个园,它还可以是更复杂的闭环后者闭球)
- Logistic回归
- Logistic回归
- logistic回归
- Logistic 回归
- Logistic 回归
- logistic回归
- Logistic回归
- Logistic回归
- Logistic回归
- Logistic回归
- logistic回归
- Logistic回归
- logistic回归
- Logistic 回归
- logistic回归
- Logistic回归
- logistic回归
- Logistic回归
- 常用的adb命令
- 《ACM程序设计》书中题目 V
- Android进程保活-自“裁”或者耍流氓
- 单例模式 java
- Spark分析之Master
- logistic回归
- 前k小、前k大算法
- eclipse中常用的快捷键
- 使用蓝图(Blueprint)绑定多播委托(Multicast Delegate)【UE4】【C++】
- L2-006. 树的遍历
- Spark分析之Worker
- css sprites(CSS 精灵):如何获取一张集成拼合图片上的其他图片
- 编写规范化JavaScript代码的方法总结
- 面试