贝叶斯分类器

来源:互联网 发布:c语言刷题网站 编辑:程序博客网 时间:2024/04/26 15:52

首先:


贝叶斯定理

贝叶斯定理是根据条件概率得到的。
这里写图片描述
在事件B发生前,我们需要对事件A发生的费率有一个粗略的判断,也即事件A的先验概率P(A);
在事件B发生后,我们可以对P(A)进行一个修正,变成后验概率 P(B|A)。



先验概率与后验概率
事情还没有发生,要求这件事情发生的可能性的大小,是先验概率.
事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,是后验概率.:是(p(B|A)
一、先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为“由因求果”问题中的“因”出现。后验概率是指在得到“结果”的信息后重新修正的概率,如贝叶斯公式中的,是“执果寻因”问题中的“因”。先验概率与后验概率有不可分割的联系,后验概率的计算要以先验概率为基础。


之前概率数上的一个例子就是:

三家厂家按一定比例把总体划分了。咱们知道的先验概率是三家的正品率。

而当我们取到了一个正品,想要得知该产品来自甲家(由某个因素引起的可能性的大小,)是后验概率。

我们可以根据后验概率的大小,选取后验概率大的那个来决定是由那个因素引起的这个事。



1.贝叶斯决策论:

如何基于概率和误判损失奥选择最优的类别标记(产品来自于哪一家)

机器学习所要实现的是基于有限的训练样本尽可能的准确的估计出后验概率。(500个样本具有x特征的样本是B类,那么给出一个对象,这个对象具有x特征,那么他是否可以归到B

类)


2.极大似然估计

根据所给训练样本集,无法确定先验概率和似然概率。估计一下这个样本服从哪个分布(需要估计参数),进而求的先验概率和似然概率。

估计一个参数r,使出现样本观察值的概率最大。(利用已知的样本结果反推最有可能(最大概率)导致这样结果的参数值。

函数y:样本X1...Xi联合概率分布

自变量:参数

把现已有的样本值带入,求这个函数的最大值。==》极大似然估计。



3.朴素贝叶斯(采用了“属性条件独立性假设”:对已知类别,假设所有属性相互独立。换言之,假设每个属性独立的对分类结果发生影响。厂家对应属性,已知该商品来自a厂商或者b厂商,求这个商品是正品的概率,  )


4.半朴素贝叶斯分类器(一个折中,进步需要进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系)

 独依赖估计(ODE)

5.贝叶斯网

notend

原创粉丝点击