Naive Bayes VS Logistic Regression

来源:互联网 发布:ubuntu update 失败 编辑:程序博客网 时间:2024/04/29 21:06

NB和LR的区别

http://www.quora.com/What-is-the-difference-between-logistic-regression-and-Naive-Bayes

www.cs.cmu.edu/~tom/mlbook/NBayesLogReg.pdf

作为生成模型NB从样本数据中模拟P(X|Y)和P(Y),而作为判别模型的LR,直接对数据lable:Y的分布进行模拟

由NB的条件独立假设,就是对于数据X=(x1,x2,.......),各个属性之间的条件概率分布式独立的,P(xi|Y)和P(xj|Y)不相关

这样可以大大减少参数的个数(如果相关的话,需要求解P(x1,x2,...|Y)等联合概率分布的参数),对与离散的NB问题,可以用最大似然对参数进行估计,也可以进行适当的平滑;

对于连续变量的NB,如果再假设每个属性分布P(xi|Y)符合正太分布,就是高斯朴素贝叶斯分类器(GNB)。对于GNB,使用最大似然对均值和方差进行估计时,均值的期望与真实期望相同,但方差的期望存在偏差(N/(N-1) * 方差);GNB可以通过形式变换,变换成LR的形式:


与LR有等价的形式:



而对于LR,是直接估计参数W,对分类结果直接判断,对于LR的求解可以使用梯度下降的方法,归一化的LR对应于最大化后验概率Maximum a Posterior

总结一下:

如果GNB假设成立,在渐进意义上,NB和LR会收敛成同一个分类器,否则,二者一般会训练处不同的分类器,这时,当数据量无限时,LR的结果往往比NB要好

LR不必假设数据的各个属性之间必须是相互独立的,对于不满足假设的数据,LR会在训练过程中对W参数自动调整

但是GNB与LR相比,GNB会快速的收敛,并且需要log n (n是数据维度)级别的样本数据。而LR需要n级别的数据,这时,对于小数据量下,GNB可能会比LR好一些!


0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 小米陶瓷刀钝了怎么办 橱柜的缝擦不到怎么办 悠悠球上油早了怎么办 买了没有esp的车怎么办 饥荒海难狗来了怎么办 饥荒海难拖网掉水里了怎么办 饥荒遇到了猪人怎么办 饥荒龙蝇赖在家不走怎么办 饥荒海难崩档了怎么办 gta5全是rpf文件怎么办 饥荒没有海象人营地怎么办 饥荒海滩猎犬来了怎么办 宝宝换牙门牙上长颗尖牙怎么办 肉卡在牙缝里怎么办 电脑做系统卡死怎么办 苹果6升级太卡怎么办 电脑玩不了联机饥荒怎么办 饥荒渡渡鸟死了一只怎么办 饥荒电脑联机植物生病怎么办 开车蹭到别人车怎么办 立定跳不会收腹怎么办 1岁宝宝有蛔虫怎么办 手机屏幕总是有网页跳出来怎么办 cs游戏屏幕变成正方形怎么办 大王卡被收回了怎么办 模拟人生4小人生病了怎么办 创造与魔法死后怎么办? 脚不小心扭伤了该怎么办 小鸡脚扭伤了该怎么办 跳高比赛最终成绩相等怎么办 热车1200怠速降不下来怎么办 大腿根骨髓水肿越来越疼怎么办 倒库方向打晚了怎么办 签吻芳颜祛斑液脸脱皮怎么办 3d右边工具栏消失了怎么办 3d菜单栏消失了怎么办 觉得自己性无能不敢谈对象怎么办 护士面试时被问到病人坠床怎么办 三次元仪器坏了怎么办 运动同手同脚怎么办 狗狗突然害怕不敢走路怎么办