朴素贝叶斯分类
来源:互联网 发布:spss mac版 编辑:程序博客网 时间:2024/04/30 23:35
一、背景知识
1. 概况
分类:根据概率论进行分类的方法,本质上是有监督的训练方式,概率值最大对应的类别即为所属的类别。
朴素:为了简化计算和公式,做出最原始和最简单的假设,即特征之间是相互独立的、每个特征是同等重要的。
2. 贝叶斯公式
Ci表示类别,W表示特征向量。
类比到语音识别的声学得分即为将求似然概率问题P(Ci|W)转化为求后验概率问题P(W|Ci),P(Ci)表示先验概率,P(W)是常量。
二、实例
社区论坛屏蔽侮辱性的言论。
1. 将文本转化为词向量
生成所有词的列表w,对应于一句话,将w中该句话里面所有的词设为1,其他设为0。
2. 计算
P(W|Ci): 对应于Ci分类的总的词数为N,Ci分类中单词Wi出现的频率为Ni,则Ni/N即为所求的概率。P(W|Ci)=P(W0|Ci)* P(W1|Ci) * P(W2|Ci)*…
3. 分类
对于输入文本,将其转化为词向量,与P(W|Ci)相乘累加,观察对应于哪个分类的概率最大。
三、参考
1. 《机器学习实战》
2. http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html
3. http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/
0 0
- 朴素贝叶斯分类
- 朴素贝叶斯分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯--情感分类
- 朴素贝叶斯分类器
- 朴素贝叶斯—分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯分类
- 分类-朴素的贝叶斯
- 朴素贝叶斯分类器
- 朴素贝叶斯分类器
- 朴素贝叶斯分类器
- PermGen Space
- 计算公元纪年法总天数及星期几(用自己的一个思路)查询日历保存到文本文件
- JavaScript的generator示例代码
- c语言002——c语言在不同平台下运行(linux,windows)
- get和post之间的区别http://blog.csdn.net/yipiankongbai/article/details/24025633
- 朴素贝叶斯分类
- Application.mk常用变量
- ADO.NET与Oracle(一):获取多行记录集
- Redis 2.8 配置文件说明
- Log4j配置理解
- 第三单元作业 3.23
- 【leetcode】Remove Duplicates from Sorted Array
- node.js url 模块使用时的小trick
- iperf的相关介绍