朴素贝叶斯分类理解

来源:互联网 发布:地铁体检不合格知乎 编辑:程序博客网 时间:2024/06/01 08:47

有关贝叶斯理论和定理、以及贝叶斯算法和应用大家可以百度出来上千篇博文或者网页,对于贝叶斯理论的解释都比较透彻。个人比较喜欢一种采用两种事件的交集概率来解释贝叶斯分类。这里也来阐述一下。

首先正常的概率是指在一定条件下发生某事件的可能性有多大。比如明天天气下雪的概率问题,出门捡到钱的概率,买彩票中大奖的概率问题。说明天天气下雪的概率,这是一种预测,基础条件可能包括冷空气到来、空气湿度增大等,也就是在条件1:冷空气到来,条件2:空气湿度增大,满足的情况下会下雪,用概率公式表示:P(下雪| 冷空气、空气湿度大)=1。出门捡到钱的概率,也是一种预测,需要的条件包括:心情好、天气好、运气好、别人丢钱等,也就是在这些条件都满足的情况下才能捡到钱。用概率公式写就是P(捡到钱| 心情好、天气好、运气好、别人丢钱)=1。

贝叶斯概率就是“逆概率”,什么意思呢?如上面出门捡到钱的概率问题,正常是在心情好、天气好、运气好、别人丢钱的条件下捡到钱的概率为1,这是正常的概率事件;而贝叶斯说的问题就是反过来,我出门捡到钱了,请问我今天心情好的概率是多大,天气好的概率是多大,运气好的概率是多大,别人丢钱的概率是多大。数学上表示就是P(心情好、天气好、运气好、别人丢钱|捡到钱)=?

再用一个简单理解的例子,比如一个桶中放了5个球,其中三个球是黑色的,两个球是白色的。正常情况下我随手抓一个,请问拿到黑色球的概率是多大,拿到白色球的概率是多大?

计算一下:P(黑球)=3/5=0.6,P(白球)=2/5=0.4。

也就是随手拿一下,闭着眼睛猜,60%的可能性拿到黑球,40%可能性拿到白球。由于拿到黑球的概率明显大于白球概率,实际上最终的球是黑球的可能性要大于白球可能性。

现在讲5个球放置在两个桶中,A桶和B桶。其中A桶放3个球,黑球占2个,B桶放2个球,黑球占1个。现在问随便取出一个球,其为黑球的概率有多大?如果来自于A桶,即P(黑球|A桶)=?很容易计算,这个概率就是2/3,同理P(黑球|B桶)=1/2。

从另外一个角度来计算,首先A桶中有3个球,球的总数为5个,那这个球来自于A桶的概率就是3/5;如果球来自于A桶,即前面条件成立的情况下,黑球占2个,那随手取的那个黑球的概率:P(黑球)=2/5,因此这个球来自A桶而且是黑球的概率就可计算为:P(黑球|A桶)=P(A桶+黑球)/P(A桶)=(2/5)/(3/5)=2/3。

同理P(黑球|B桶)=P(B桶+黑球)/P(B桶)=(1/5)/(2/5)=1/2。

用集合方式可以表示:P(黑球|B桶)=P(B桶与黑球交集)/P(B桶)

通过上述的例子,我们可以看到,贝叶斯概率就是一种条件概率计算。条件概率(Conditional probability)就是指在事件B发生的条件下,事件A发生的概率,用P(A|B)来表示。

给一个文式图如下:


对于求在B事件知道的情况下A条件发生的概率,就是求解交集部分占B的比例大小。因此P(A|B)= P(A与B的交集)/P(B)。那A与B的交集出现的概率就可以已知的A条件下B发生的概率来求解,即P(A与B的交集)=P(A)*P(B|A)。

由此条件概率计算公式,也即朴素贝叶斯定理为:

P(A|B)=P(B|A)*P(A) / P(B)。

对于一个多个条件存在的判断问题,如果假设各个条件是相互独立的,条件之间没有交集,上式是完成成立的。

朴素贝叶斯定理虽然简单,容易理解,但实用性很强。百度上可以搜到很多有关利用朴素贝叶斯定理来判别预测的实例。


原创粉丝点击