程序博客网 > 仙桃广电网络客服电话

4-Logistic Regression

来源：互联网发布：仙桃广电网络客服电话编辑：程序博客网时间：2024/04/28 21:38

1 - Classification

Logistic Regression解决的并不是regression问题，而是分类(Classification)问题。例如：Email(Spam/Not)、Tumor(Malignant/Benign)
此时，不能再用Linear Regression的Gradient Descent方法来拟合了，现在的问题需要用Logistic Regression来解决，对用的Hypothesis函数取值范围必须在0-1之间。

2 - Hypothesis Representation 拟合函数

Hypothesis： hθ(x)=g(θTx)
- hθ(x)代表y=1的可能性的大小
- 若h大于0.5，那么就取1，如果小于0.5就取0.
Sigmoid function/Logistic function： g(z)=11+e−z
- 当 z >=0，0.5 <= y < 1
- 当 z< 0，0 < y < 0.5

3 - Decision Boundary 分类边界

对于2中的公式，可知，当 θTx >= 0 时，y = 1; 当 θTx < 0 时，y = 0。此时 θTx >= 0 即为Decision Bounday。
分类边界类型：
- 直线：hθ(x)=g(θ0+θ1x1+θ2x2)
- 圆：hθ(x)=g(θ0+θ1x1+θ2x2+θ3x21+θ4x22)
- 更复杂的：hθ(x)=g(θ0+θ1x1+θ2x2+θ3x21+θ4x21x2+θ5x21x22+θ6x31x2)

4 - Cost Function 代价函数

J (θ) = 1 m \sum i = 1 m C o s t (h θ (x (i)), y (i)) C o s t (h θ (x), y) = {- l o g (h θ (x)) i f y = 1 - l o g (1 - h θ (x)) i f y = 0 N o t e : y = 0 o r 1 a l w a y s

关于Cost函数
- 通过maximum likelihood estimation(即极大似然估计)计算得来。
- 之所以不用原来线性回归的误差公式，是因为Sigmoid函数的存在会使J函数最终的结果不是凸函数，存在多个极值点。

5 - Simplified Cost Function and Gradient Descent 简化的代价函数、梯度下降法

Cost Function：

J (θ) = 1 m \sum i = 1 m C o s t (h θ (x (i)), y (i)) = - 1 m [\sum i = 1 m y (i) l o g (h θ (x (i))) + (1 - y (i)) l o g (1 - h θ (x (i)))]

现在要求的是满足时的 θ 的取值，那么可以采用Gradient Descent方法来求得：
$R e p e a t {θ j : = θ j - α \partial \partial θ j J (θ) (s i m u l t a n e o u s l y u p d a t e a l l θ j)}$
而代入偏导结果之后是：
$R e p e a t {θ j : = θ j - α \sum (i) m (h θ (x (i)) - y (i)) x (i) j (s i m u l t a n e o u s l y u p d a t e a l l θ j)}$
梯度下降公式与线性回归中的完全相同！

6 - Advanced Optimization 高级优化

6.1 计算条件

要想计算Cost function的最小值，除了Gradient Descent还有其他方法。首先理清计算条件：

J(θ)
∂∂θjJ(θ)
θ初值

6.2 其他算法
主要有：

Conjugate gradient
BFGS
L-BFGS

与Gradient Descent相比较，这些算法：

优点：
- 不需要人工选择α的值
- 通常比gradient descent运行快
缺点：
- 更加复杂(实现起来比较)

6.3 高级算法的使用方法

实现一个costFunction：
- 输入：theta(列向量)
- 输出：jVal(误差的值)、gradient(θ的调整量，列向量)
调用fminunc函数：
- 输入：@costFunction，initialTheta，options
- 输出：optTheta(计算出的θ值)，functionVal(最小误差)，exitFlag
- 其中：options为函数参数选项，例如 options = optimset('GradObj', 'on', 'MaxIter', 100);

示例：

function [jVal, gradient] = costFunction(theta)jVal = (theta(1)-5)^2 +(theta(2)-5)^2;gradient = zeros(2,1);gradient(1) = 2*(theta(1)-5);gradient(2) = 2*(theta(2)-5);options = optimset('GradObj', 'on', 'MaxIter', 100);initialTheta = zeros(2,1);[optTheta,functionVal,exitFlag] = fminunc(@costFunction,initialTheta,options);

7 - Multiclass Classification- One-vs-all

多值分类问题：

Email tagging：Work、Friends、Family、Hobby
Medical diagrams：Not ill、Cold、Flu
Weather：Sunny、Cloudy、Rain、Snow

解决办法：One-vs-all(one-vs-rest)

为每一个类别训练一个logsitic regression分类器。
当输入x时，分别计算每个分类器的hθ(x)的值，选取最大的作为其分类。

0 0

仙桃广电网络客服电话

仙桃广电网络客服电话

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子面筋的制作方法面筋是豆制品吗洗面筋的做法面筋制作方法孜然面筋的做法孜然面筋做法面筋怎么做才好吃腿里面筋疼怎么回事面筋泡的做法面筋怎么烧好吃做面筋用什么面粉手工面筋的制作方法面筋怎么煮好吃面筋是什么做的煮面筋的做法面筋的做法大全家常菜做法凉拌面筋的家常做法自制面筋的做法面筋怎么制作蒸面筋的做法怎么做面筋串油炸面筋的做法面筋的营养价值和功效面筋的吃法大全面筋的做法大全面筋的做法及配方图解干面筋怎么泡白菜面筋的做法独面筋的做法大全烤面筋的做法与配料面筋的做法大全家常面筋的家常做法炸面筋怎么做好吃面筋怎么烤好吃做面筋的方法烧烤面筋的制作方法面筋怎么做的独面筋的做法凉皮面筋怎么做才蓬松凉皮里的面筋怎么做小吃烤面筋技术培训