朴素贝叶斯分类:拉普拉斯修正

来源:互联网 发布:为知笔记企业版 编辑:程序博客网 时间:2024/05/17 04:59

拉普拉斯修正

上面通过这个例子折射处一个问题:训练集上,很多样本的取值可能并不在其中,但是这不并代表这种情况发生的概率为0,因为未被观测到,并不代表出现的概率为0 。

正如上面的样本,看其他两个属性很可能属于好苹果,但是再加上颜色:青色,这三个属性取值组合在训练集中并未出现过,所以朴素贝叶斯分类后,这个属性取值的信息抹掉了其他两个属性的取值,在概率估计时,通常解决这个问题的方法是要进行平滑处理,常用拉普拉斯修正。

拉普拉斯修正的含义是,在训练集中总共的分类数,用 N 表示;di 属性可能的取值数用 Ni 表示,因此原来的先验概率 P(c) 的计算公式如何修正的呢?

请看公众号文章:

朴素贝叶斯分类:拉普拉斯修正

算法与机器学习

这里写图片描述

原创粉丝点击