林轩田机器学习基石观后笔记——逻辑回归(logistic regression)

来源:互联网 发布:淘宝经营模式是什么 编辑:程序博客网 时间:2024/05/17 00:09

1.什么情况下用到逻辑回归?
例子:我们手中的资料是病例,上面记载着病人的身体状况以及是否心脏病发,现在要求根据病人的身体状况预测他心脏病发的几率。即我们拿到的训练样本的输出是二分类输出{+1,-1},而我们需要训练出的函数的输出是0~1之间的数。

2.问题描述
已有N个样本这里写图片描述 ,样本资料的输入由d维特征表示这里写图片描述 , 每个样本的输出这里写图片描述 ,要求学习出一个函数h(x),输出一个概率。
可简单描述为以下过程:
由输入样本X得到一个分数:这里写图片描述
再将该分数转化为0~1的数,一般使用logistic function: 这里写图片描述
所以该问题就转化为求出合适的w,使得该函数在已有样本的错误率最小。

3.该模型的错误估计
由于逻辑回归的训练样本和测试样本的输出不同,在训练时我们如何判断训练的效果呢?我们运用交叉熵代价函数(Cross-entropy error)来估计:这里写图片描述
所以最终的问题即求出使得这里写图片描述最小的w.

4.求解最小错误的方法——梯度下降(gradient descent)
①初始w0;
②更新w:这里写图片描述
如何选择学习方向这里写图片描述:如何更新w才能保证这里写图片描述变小呢?推导过程如下: 这里写图片描述,当 和 方向相反时内积最小,所以 这里写图片描述
如何选择学习速率这里写图片描述:考虑稳定性和速率的平衡,这里写图片描述太大,则速度快但可能漏掉最优值, 这里写图片描述太小则比较稳定但速度太慢。
③更新终止条件:这里写图片描述
最终求得的w即为在训练样本上有最小的错误。

0 0
原创粉丝点击