朴素贝叶斯
来源:互联网 发布:怎样制作淘宝网页 编辑:程序博客网 时间:2024/05/16 12:01
一个利用贝叶斯公式来进行分类的naive方法,它建立在一个很强悍的假设条件上:即特征之间都是相互独立的,且特征们是同等重要的
贝叶斯公式
好吧,上面这段写的自己都看不明白了。以文本分析为例,如果要给一些文本去按主题分类,这里的
既然我们只想知道哪个
然而这个条件联合概率
这样,目标函数就出炉了:
当然,这个条件独立性假设其实是不太合理,有些时候有些词之间就是会有很强的相关性。针对这种情况,我们可以调整一下朴素贝叶斯的词典设置,不仅以单个的词汇做特征,还可以以连续的两个词等,此为ngram,在之后的sklearn naive bayes库里会提到。
另外还可以根据词汇之间的相关性绘制概率图模型,偶们称之为贝叶斯网络,较出名的即为马尔科夫模型,此为后话。
根据
- 高斯NB
P(xi|y)=12πδ2y−−−−√exp(−(xi−μy)22δ2y)
其中的参数是通过极大似然估计获得的。
- 多项式NB
将词汇出现的频率作为概率
这里
分子分母都加上一个数主要是因为,若
- 伯努利NB
不管频率多少,只看出现或是不出现,这就是伯努利贝叶斯的方法:P(xi|y)=P(i|y)xi+(1−P(i|y))(1−xi)
公式不是很懂,意思就是那么个意思,留个疑问吧。这种binary的方法一般在文档较短的时候效果可能会好。因此做文本分析时可以都尝试一下。
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- 朴素贝叶斯
- Mybatis——返回主键的几种方式
- halcon/c++接口基础 之 构造函数与Halcon算子
- CheatEngine-实验吧CTF题库writeup
- runloop补充
- Linux-apache服务器
- 朴素贝叶斯
- 2016年总
- 使用Fresco遇到的坑。
- Hust oj 2000 极差(水题)
- java.util.UUID.fromString() 方法使用详解
- matlab基础知识
- halcon/c++接口基础 之 析构函数和Halcon算子
- 占位占位占位占位占位
- 对js中call、apply和bind的理解