4.3 概率判别式模型
来源:互联网 发布:java常用工具 编辑:程序博客网 时间:2024/05/01 02:26
4.3 概率判别式模型
1、判别式模型
生成式模型的核心思想是通过最大似然法求出类概率密度的参数和类先验概率密度,然后用贝叶斯公式求出后验概率密度。是一种间接性的方法。在本节中,我们将显⽰地使⽤⼀般的线性模型的函数形式,然后使⽤最⼤似然法直接确定它的参数。
2、固定基函数
⽬前为⽌,我们已经考虑了直接对输⼊向量
3、logistic 回归
在上节中我们将二分类问题的后验概率写成作⽤在特征向量
这个模型被称为 logistic 回归。
对于⼀个
对于一个数据集
我们可以通过取似然函数的负对数的⽅式,定义⼀个误差函数。这种⽅式产⽣了交叉熵( cross-entropy )误差函数,形式为:
两侧关于
最⼤似然⽅法⽆法区分某个解优于另⼀个解,并且在实际应⽤中哪个解被找到将会依赖于优化算法的选择和参数的初始化。注意,即使与模型的参数相⽐数据点的数量很多,只要数据是线性可分的,这个问题就会出现。通过引⼊先验概率,然后寻找
4、迭代重加权最小平方
由于logistic函数是非线性函数,其最大似然解没有解析解,但由于误差函数是凸函数,可以确定其存在唯一的最小值,我们可以用一种迭代法逼近这个最优解。这种迭代⽅法基于 Newton-Raphson 迭代最优化框架,使⽤了对数似然函数的局部⼆次近似。为了最⼩化函数
其中
首先考虑在线性模型中使用该迭代法,误差函数为平方和误差函数。这个误差函数的梯度和Hessian矩阵为:
其中
于是Newton-Raphson 更新的形式为:
可以看到这是标准的最⼩平⽅解。
现在考虑把该迭代法在logistic交叉熵误差函数中使用,误差函数的梯度和Hessian矩阵为:
其中
可以看到
于是Newton-Raphson 更新的形式为:
其中
更新公式的形式为⼀组加权最⼩平⽅问题的规范⽅程。由于权矩阵
5、多类 logistic 回归
在生成式模型中,我们得到类后验概率的表示:
其中,
生成式模型中处理的方法是用最大似然法求出类条件概率和先验概率,再间接求出后验概率从而确定参数
似然函数为:
(待续)
6、probit回归
指数族分布一大类的类条件概率分布的后验概率都是logistic形式,但还有一部分的后验概率分布不是如此简单的形式,所以有必要考虑其他的模型。
考虑一般的二分类线性模型:
其中
设置目标值:
如果
假设
这被称为逆 probit ( inverse probit )函数。它的形状为 sigmoid 形,注意,使⽤更⼀般的⾼斯分布不会改变模型,因为这样做等价于对线性系数
它被称为erf函数或error函数,它与probit函数的关系是:
基于probit激活函数的一般线性模型成为probit回归。通常情况下probit回归得到的结果与logistic回归接近,但对于离群点probit函数更加敏感,因为对于
7、标准链接函数
- 4.3 概率判别式模型
- 分类的线性模型:概率判别式模型之逻辑回归LR
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- [转载]判别式模型和产生式模型
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- 判别式模型与生成式模型(一)
- 判别式模型与生成式模型(二)
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- 生成模型与判别式模型的区别
- 判别式模型与生成式模型
- 判别式模型与生成式模型
- Measure of similarity
- Android高德地图使用
- 沉浸式状态栏颜色设置,对android4.4~6.0的总结
- 讯飞语音听写开发入门之获取appid号
- C++第七次上机实验
- 4.3 概率判别式模型
- 剑指offer-28字符串的排列
- 2015级C++第15周程序阅读 范型程序设计
- static const extern在C与C++中的区别
- 每日一得--关于Integer大小比较的问题
- 码表dashboard仪表盘自定义View的开发
- Android 开发资源整合
- 根据IP解析地址
- iOS -- CALayer之简单的使用