逻辑回归寻找最佳θ向量
来源:互联网 发布:出货单打单软件 编辑:程序博客网 时间:2024/05/16 06:56
3 寻找θ向量
前面介绍了如何在实际场景中使用预测函数计算概率,但是关键在于如何找到合适的
向量。本节重点讨论这方面的数学原理。
3.1 最大似然公式
不过一般情况下,我们是没有办法轻易获得θ的。所以需要一些方法来推导出θ。如果训练集 T 为
为自变量对应的分类(1 或者 0), 可以应用对数似然估计法估计参数θ
3.1.1 先建立概率公式
这里 y=0 或者 1,这是一个常用的技巧,通过 y=0 或者 1 将两个概率公式组合在一起。
3.1.2 建立似然公式
这个公式这样理解
- 1 批样本中每个样本的特征向量
x1,x2,…,xn
分数这么表示:概率>0.5 的判定为预测为 1, 分数就取
把每个样本的评分相乘就得到这批样本在取
- 向量,使得总评分最高这需要用到最大似然公式
3.1.3 建立最大对数似然公式
最大似然公式通常用对似然公式取对数来简化计算,因为
- 对数函数是单调递增的,可以用它来找似然公式的最大值
- 对数可以将乘法转换成加法,参考对数运算法则,从而简化计算
对上式采用最大对数似然公式
需要找到使得这个 l 函数为最大值时的
3.2 损失函数
引入 J 函数把上面的求最大值问题被转换成了求 J 函数的最小值问题,J 函数也就是损失函数,损失自然越小越好.
3.3 梯度下降公式
3.3.1 推导
这里可以使用梯度下降法找到
的值。推导过程用到了偏导
现在需要通过多轮迭代,找到
向量,使得 J 函数最小。迭代的梯度下降公式为:(这里 x 有偏导计算)
- 说明
θj
- 求偏导
对
求偏导的推演为
- 注意
- 这里的 log 就是 ln
- 最后两步推导用到了复合函数求导法则
继续推导
最后,将逻辑回归公式代入,进行推导
- 注意
∂∂θjg(θTx)
最终求
的梯度迭代公式为:
- 说明
- 一般通过观察的大小来判断是否已经收敛到了极小点附近
- 那迭代多少次停止呢,spark ML 可以指定迭代次数和比较两次梯度变化或者 cost 变化小于一定值时停止
- 几何意义
此时θ
- 向量
3.3.2 计算优化
- 向量化 Vectorization
Vectorization 是使用矩阵计算来代替 for 循环,以简化计算过程,提高效率
- 参考
logistic 回归详解(三):梯度下降训练方法机器学习入门:线性回归及梯度下降
3.4 正则化
3.4.1 用途
在样本数量小,特征数量多的情况下,容易出现过拟合。可以通过正则化来减轻过拟合的现象。正则化的方法,就是给代价函数后面加个“惩罚项”……来降低它对数据的拟合能力。
3.4.2 正则项
其实就是在损失函数里加上一个正则项,
现在的梯度下降公式是:
3.4.3 使用
正则化参数
0 0
- 逻辑回归寻找最佳θ向量
- 逻辑回归,决策树,支持向量机 选择方案
- 逻辑回归、决策树和支持向量机(I)
- 逻辑回归、决策树和支持向量机(I)
- 逻辑回归、决策树和支持向量机(I)
- 逻辑回归、决策树和支持向量机的直观理解
- 逻辑回归 vs 决策树 vs 支持向量机(I)
- 逻辑回归 vs 决策树 vs 支持向量机(II)
- 逻辑回归、决策树和支持向量机(I)
- 逻辑回归、决策树和支持向量机(II)
- 逻辑回归、决策树和支持向量机(I)
- 逻辑回归 vs 决策树 vs 支持向量机(II)
- 逻辑回归和线性支持向量机之间的区别
- 使用牛顿法确定逻辑斯谛回归(Logistic Regression)最佳回归系数
- 逻辑回归
- 逻辑回归
- 逻辑回归
- 逻辑回归
- JS常用函数
- 数据库的影响(一)
- 第五单元作业
- 安卓模拟器打不开
- RecyclerView Animators
- 逻辑回归寻找最佳θ向量
- Android 图片轮播,图片左右自动滚动与页面侧滑菜单冲突,请问怎么解决?
- 通过单选按钮的value值判断一个文本框是否有用!求解决方案
- 双缓冲自绘制WinForm Listbox控件实现方法
- SpringMVC访问静态资源的三种方式
- ZCMU—1465
- U盘安装Windows和Ubuntu 15.04双系统图解教程
- js客户端加密
- 会场安排问题