程序博客网 > 抽数字软件

指数族和广义线性模型（The exponential family and Generalized Linear Models）

来源：互联网发布：抽数字软件编辑：程序博客网时间：2024/06/06 02:51

指数族的概率密度形如：

对所有的θ：

所以：

当T(x) =x，A(θ)是h(x)的Laplace变换的log形式。

下面我们给出常见的概率分布：

之后，我们转向我们熟悉的形式：

η被称为natural parameter或者canonical parameter，T (y)被称为sufﬁcient statistic（a statistic

is a function of data，通常有T (y) = y），a(η)被称为lognormalizer，保证密度函数的积分为1。

1.我们将Bernoulli分布写成指数族的形式：

其中：可推出φ=1/(1 +e^- η)，η的形式与logistic函数一致，因为logistic回归的前置概率是伯努利（Bernoulli.）分布

然后

2.接下来再考虑高斯分布（Gaussian），由于高斯分布的方差与我们最后对θ和h(x)的选择无关，为了简便，将方差设为1。

然后有

其中

3.多项式分布（Multinomial.）

其中

与Bernoulli同样的操作：

其中

4.泊松分布（Poisson.）

泊松分布是一个离散的分布，

其中

5单变量高斯分布（UnivariateGaussian），这次是完整的形式：

其中

在指数族分布里，a(η)函数其实是一种生成函数（generating function），可以派生出：

同时：

在Bernoulli分布中，，可以导出

通过引入指数族，我们可以导出广义线性模型（下文简称为GLM），首先GLM有三个形式化的假设:

对高斯分布来说，我们有µ = η，所以

对Logistic Regression来说，我们研究的是一个二类分类，所以y ∈ {0, 1}。由于y的取值特点，我们自然而然选择Bernoulli分布，我们有

如果y|x; θ ∼ Bernoulli(φ)，则E[y|x; θ] =φ，我们有

我们可以得到，一旦我们认为y|x服从Bernoulli分布，我们就会得到Logistic Regression。

Bernoulli的正则响应函数为logistic函数

对于

g是链接函数，令我们有

对于形如以下的指数族

均值和方差满足

又有

我们可以给出常见分布的正则链接:

0 0

抽数字软件

抽数字软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子水等于多少斤一顿水多少升 1升等于多少斤水升水和贴水 1立方水等于多少升 1升水等于多少毫升一升水 4升和9升称出6升水 1升水等于多少立方米 19升水等于多少斤斗升之水 60升水有多少斤鱼缸100升水放多少盐水一升等于多少斤升水贴水一桶水多少升一升多少斤水 5升水等于多少斤 40升水等于多少斤一升水等于多少公斤 2升水等于多少斤桶装水一桶多少升 9升4升水如何倒6升 1立方米水等于多少升 1公斤水等于多少升一升水多少钱期货升水 1升水多少钱远期升水 2升水一升水是多少 100升水是多少斤一升水有多少两升水是多少 200升水等于多少斤一升水是多少斤一升水等于多少克一升水多少克 1升水等于多少克 1升水等于多少公斤三升水是多少