logistic regresson模型

来源:互联网 发布:java list 线程安全 编辑:程序博客网 时间:2024/05/16 05:14
 

Logistic regression回归(也叫做[logisti模型]或者[logit模型]), 被用于通过拟合一个logistic curve预测一个事件发生的概率

其为用于解决binomial regression(二元回归也就是最后的函数值为2)的广义线性模型(generalized linear model). 就像别的形式的回归分析一样它利用许多的预测变量(predictor variables), 这些变量可以是数值或者分类的例如....

 

logistic function:

其中z的范围是整个实数范围而输出的结果则是在(0,1)之间.

 

 

 

 

其表示的图形如下:


 

The variable z represents the exposure to some set of risk factors, while f(z) represents the probability of a particular outcome, given that set of risk factors. The variable z is a measure of the total contribution of all the risk factors used in the model and is known as the logit.

f(z), ; z表示总的risk factors.

 

 

 

Figure 1. The logistic function, with z on the horizontal axis and f(z) on the vertical axis.

 

 

 

 

其中的变量z一般用如下表示

其中的 β0表示截距(intercept)

β1, β2, β3 分别表示 x1x2x3 的回归系数(regression coefficients), intercept是当所有的risk factors0的时候的值正向回归因子(a positive regression)risk factor增加输出的概率而负向回归系数(a negative regression)则是减少大的回归系数意味着对于输出结果的影响大而接近0的回归系数意味着对于输出的结果影响较小.

 

 

LR是一种比较有用的描述一个或者多个risk factors(age,sex, etc.).

 

 

 

原创粉丝点击