机器学习信仰之朴素贝叶斯法

来源：互联网发布：毕向东java视频百度云编辑：程序博客网时间：2024/05/16 19:09

敲黑板，划重点

上大学那会，贝叶斯定理是用来求条件概率的；现在才知道，贝叶斯定理其实是在讲先验、似然与后验的故事。贝叶斯定理是一种信仰。

1、频率学派与贝叶斯学派

频率学派认为，概率表述一件事发生的频率，是客观存在的一个值；同时，样本X时随机的，所以频率派重点研究样本空间，大部分的概率计算都是针对样本X的分布
贝叶斯学派认为概率是我们的个人的主观概念，表示我们对某件事发生的相信程度。待估计的概率theta是随机变量，服从一定的分布，而样本X时固定的，重点研究的是theta的分布。
贝叶斯学派中有了三个概率：先验概率(Prior Probability)、似然函数(likelihood function)和后验概率(Posterior Probability)；贝叶斯派思考的固定模式：先验分布+ 样本信息−>后验分布

2、生成模型与判别模型

这里写图片描述

3、朴素贝叶斯法

朴素贝叶斯法，其中的朴素是指，特征条件独立假设，即输入特征之间是相互独立的。
朴素贝叶斯法是在特征条件独立假设的前提下，求得输入、输出的联合概率分布；再依据此模型，计算输入x下，依据贝叶斯定理求得最大后验概率的y。可见，朴素贝叶斯法是生成模型。

3.1 基本原理

设输入空间X是n维(X1, …Xn); 输出空间Y是k维(c1, c2, ….ck);
朴素贝叶斯法通过训练数据学习X，Y的联合概率分布P(X, Y)。具体的：
先验概率：P(y=ck), k=1,2…K
条件概率分布：P(X=x|y=ck) = P(X1=x1, …Xn=xn | y=ck)
依据特征条件独立性的假设，
这里写图片描述