分类-3-生成学习-1-问题引入

来源:互联网 发布:asp网站源码 编辑:程序博客网 时间:2024/06/05 06:09

在之前的学习方法中,我们的目的是求p(y|x,θ),即求y在x的条件下的概率。例如在逻辑回归中我们的模型是hθ(x)=g(θTx),其输出结果就是预测样本属于某个类别的概率。对于二分类来说,它们的目的就是为了找到一个分割线(超平面)将样本划分为2类。当测试一个输入样本时,只需要看这个样本在分割线(超平面)的哪一侧。

回想贝叶斯公式:

p(y|x)=p(x|y)p(y)p(x)

学过概率理论的人都知道条件概率的公式:P(AB)=P(A)P(B|A)=P(B)P(A|B);即事件A和事件B同时发生的概率等于在发生A的条件下B发生的概率乘以A的概率。由条件概率公式推导出贝叶斯公式:P(B|A)=P(A|B)P(B)P(A);即,已知P(A|B)P(A)P(B)可以计算出P(B|A)
P(A)A的先验概率或边缘概率。之所以称为”先验”是因为它不考虑任何B方面的因素。
P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。
P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
P(B)B的先验概率或边缘概率,也作标准化常量(normalized constant)。
假设B是由相互独立的事件组成的概率空间{B1,B2...Bn}。则P(A)可以用全概率公式展开:P(A)=PA|B1)P(B1)+PA|B2)P(B2)+..PA|Bn)P(Bn)。贝叶斯公式表示成:P(Bi|A)=P(A|Bi)P(Bi)P(A|B1)P(B1)+P(A|B2)P(B2)+..P(A|Bn)P(Bn);因此贝叶斯公式就可变为下面形式:
P(Bi|A)=P(A|Bi)P(Bi)ni=1P(A|Bi)P(Bi)

Ax使P(x)
因此可得我们的预测结果:
这里写图片描述
注:argmaxyp(y|x),使p(y|x)y

这种方法我们称为生成模型,而之前的一些方法称为辨别模型这篇博客较为详细地介绍了两个模型

0 0