程序博客网 > 网络音乐在线听

统计学习方法第6章逻辑斯谛回归与最大熵模型（1）

来源：互联网发布：网络音乐在线听编辑：程序博客网时间：2024/05/16 23:52

统计学习方法第6章逻辑斯谛回归与最大熵模型（1）

逻辑斯谛分布

设X是连续随机变量，X服从逻辑斯谛分布是指X具有下列分布函数和密度函数：

其中μ为位置参数，γ为形状参数。

逻辑斯谛分布的密度函数和分布函数：

二项逻辑斯谛回归模型

二项逻辑斯谛回归模型是如下的条件概率分布：

对于给定的输入实例x，求得P(Y=1|x)和P(Y=0|x)，比较两个条件概率值的大小，将实例x分到概率值较大的一类。

方便起见，将权值向量和输入向量扩充，即
w=(w⁽¹⁾,w⁽²⁾,…,w⁽ⁿ⁾,b)
x=(x⁽¹⁾,x⁽²⁾,…,x⁽ⁿ⁾,1)

此时逻辑斯谛回归模型为：

一个事件的几率是指事件发生的概率与不发生的概率的比值。若事件发生概率为p，则其对数几率为：

对逻辑斯谛回归而言：

即输出Y=1的对数几率是输入x的线性函数。

参数估计

可以应用极大似然估计法估计模型参数。设：

似然函数为：

对数似然函数：

对L(w)求极大值，得到w的估计值。

这样问题就变成了以对数似然函数为目标函数的最优化问题，通常采用梯度下降法和拟牛顿法。

最大熵原理

假设离散随机变量X的概率分布是P(X)，则其熵是：

熵满足：

最大熵原理是概率模型的学习的一个准则，认为在所有可能的概率模型中，熵最大的模型是最好的模型。

最大熵原理认为要选择的概率模型首先需满足约束条件，在没有更多信息的情况下，那些不确定的部分是等可能的。

最大熵模型

给定训练数据集，可以确定联合分布P(X,Y)的经验分布和边缘分布P(X)的经验分布：

其中v表示出现频数，N表示样本容量。

用特征函数f(x,y)描述输入x和输出y之间的某一个事实：

特征函数f(x,y)关于经验分布

的期望值：

特征函数f(x,y)关于模型P(Y|X)与经验分布

的期望值：

若模型能够获取训练数据中的信息，即可假设这两个期望相等：

将该式作为模型学习的约束条件。

假设所有满足约束条件的模型集合为：

定义在条件概率分布P(Y|X)上的条件熵为：

则模型集合C中条件熵H(P)最大的模型称为最大熵模型。

阅读全文

0 0

网络音乐在线听

网络音乐在线听

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子化工是什么化工人才网化工类专业化工信息网化工招聘化工网化工企业化工网站化工仪器化工学校化工产品网化工防腐化工设计院化工市场化工废水精细化工网医药化工化工品化工集团 aes化工原料化工报价卖化工原料化工园区化工销售化工染料玉皇化工空气化工化工园有机化工化工加工厂化工石油环保化工盖德化工北京化工大学四川轻化工大学四川化工大学辽宁石油化工大学广东石油化工学院沈阳化工大学辽宁石油化工大学教务处广东石油化工