统计学习方法 6-逻辑斯谛回归与最大熵模型
来源:互联网 发布:java html转义 编辑:程序博客网 时间:2024/04/30 02:09
逻辑斯谛回归模型
逻辑斯谛分布
二元逻辑斯谛回归模型
模型参数估计
多元逻辑斯谛回归
最大熵模型
最大熵原理
最大熵原理认为,学习概率模型时,在所有可能的概率模型(分布)中,熵最大的模型是最好的模型。通常用约束条件来确定概率模型的集合,所以,最大熵原理也可以表述为在满足约束条件的模型集合中选取熵最大的模型。
最大熵模型的定义
假设满足所有约束条件的模型集合为
定义在条件概率分布P(Y|X)上的条件熵为
则模型集合
最大熵模型的学习
最大熵模型的学习过程就是求解最大熵模型的过程。
约束最优化问题:
s.t.
最大熵模型:
其中,
极大似然估计
对偶函数的极大化等价于最大熵模型的极大似然估计。
模型学习的最优化算法
常用的方法有改进的迭代尺度法、梯度下降法、牛顿法或拟牛顿法。牛顿法或拟牛顿法一般收敛速度更快。
改进的迭代尺度法
最大熵模型的对数似然函数:
目标是通过极大似然估计学习模型参数,即求对数似然函数的极大值
IIS的想法是:假设最大熵模型当前的参数向量是
令
则A(\delta|\omega)= \sum_{x,y} \tilde P(x,y) \sum_{i=1}^n \delta_i f_i (x,y)+1-\sum_x \tilde P(x,y) \sum_y P_\omega(y|x) exp(f^#(x,y) \sum_{i=1}^n (\frac {f_i (x,y)} {f^#(x,y)})) \
≥ \sum_{x,y} \tilde P(x,y) \sum_{i=1}^n \delta_i f_i (x,y)+1-\sum_x \tilde P(x,y) \sum_y P_\omega(y|x) \sum_{i=1}^n (\frac {f_i (x,y)} {f^#(x,y)}) exp(\delta_i,f^#(x,y))
令
拟牛顿法
最大熵模型:
目标函数:
梯度:
- 统计学习方法 6-逻辑斯谛回归与最大熵模型
- 统计学习方法 第6章 逻辑斯谛回归与最大熵模型(1)
- 统计学习方法 第6章 逻辑斯谛回归与最大熵模型(2)
- 逻辑斯谛回归与最大熵模型-《统计学习方法》学习笔记
- 统计学习方法笔记:逻辑斯谛回归与最大熵模型(上)
- 统计学习方法笔记:逻辑斯谛回归与最大熵模型(下)
- 《统计学习方法》笔记(6):逻辑斯谛回归&最大熵模型
- 统计学习方法:逻辑斯蒂回归和最大熵模型
- 《统计学习方法》第六章逻辑斯蒂回归与最大熵模型学习笔记
- <统计学习方法>5 逻辑斯蒂回归与最大熵模型
- 统计学习方法 李航---第6章 逻辑回归与最大熵模型
- 李航·统计学习方法笔记·第6章 logistic regression与最大熵模型(1)·逻辑斯蒂回归模型
- 统计学习方法(三) logisitic回归与最大熵模型
- 逻辑斯谛回归与最大熵模型
- 逻辑斯谛回归与最大熵分类模型
- 逻辑斯谛回归与最大熵模型
- 统计学习方法——逻辑斯蒂回归模型
- 逻辑斯蒂回归模型与最大熵模型
- 6 OF 100DAYS
- Spring Boot 03 profile的使用
- MSP430定时/计数器TimerA的使用详解(一)
- make: *** [.build_release/lib/libcaffe.so.1.0.0-rc3] 错误 1 问题解决
- openoffice java实现word转PDF
- 统计学习方法 6-逻辑斯谛回归与最大熵模型
- 测试小故事44:客观
- bitTiger讲解:Leetcode如何刷(经验分享)
- [机器学习实战] Ubuntu 16.04 + NVIDIA 384 + OpenCV 3.1.0 + CUDA 8.0 + cuDNN 5.1 踩坑记录
- Prim和Kruskal求最小生成树
- 递归算法的时间复杂度分析
- 344. Reverse String
- Could not obtain transaction-synchronized Session for current thread
- codevs 2604 舞会邀请 tarjan