贝叶斯分类器,最小二乘
来源:互联网 发布:优化的条件 英文 编辑:程序博客网 时间:2024/04/29 11:51
1贝叶斯分类器
问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率:
表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为:。
贝叶斯定理之所以有用,是因为我们在生活中经常遇到这种情况:我们可以很容易直接得出P(A|B),P(B|A)则很难直接得出,但我们更关心P(B|A),贝叶斯定理就为我们打通从P(A|B)获得P(B|A)的道路。
下面不加证明地直接给出贝叶斯定理:
朴素贝叶斯的基本思想就是对于已有的各个样本,求出在该样本出现的条件下属于所有的类别的概率,概率最大的,就判别为该类。
朴素贝叶斯分类的正式定义如下:
1、设为一个待分类项,而每个a为x的一个特征属性。
2、有类别集合。
3、计算。
4、如果,则。
其中的关键在于第三步,这是会用到贝叶斯公式来解决。1、找到一个已知分类的待分类项集合,这个集合叫做训练样本集。
2、统计得到在各类别下各个特征属性的条件概率估计。即。
3、如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:
因为分母对于所有类别为常数,因为我们只要将分子最大化皆可。又因为各特征属性是条件独立的,所以有:
下面讨论一个使用朴素贝叶斯分类解决实际问题的例子,为了简单起见,对例子中的数据做了适当的简化。
这个问题是这样的,对于SNS社区来说,不真实账号(使用虚假身份或用户的小号)是一个普遍存在的问题,作为SNS社区的运营商,希望可以检测出这些不真实账号,从而在一些运营分析报告中避免这些账号的干扰,亦可以加强对SNS社区的了解与监管。
如果通过纯人工检测,需要耗费大量的人力,效率也十分低下,如能引入自动检测机制,必将大大提升工作效率。这个问题说白了,就是要将社区中所有账号在真实账号和不真实账号两个类别上进行分类,下面我们一步一步实现这个过程。
首先设C=0表示真实账号,C=1表示不真实账号。
1、确定特征属性及划分
这一步要找出可以帮助我们区分真实账号与不真实账号的特征属性,在实际应用中,特征属性的数量是很多的,划分也会比较细致,但这里为了简单起见,我们用少量的特征属性以及较粗的划分,并对数据做了修改。
我们选择三个特征属性:a1:日志数量/注册天数,a2:好友数量/注册天数,a3:是否使用真实头像。在SNS社区中这三项都是可以直接从数据库里得到或计算出来的。
下面给出划分:a1:{a<=0.05, 0.05<a<0.2, a>=0.2},a1:{a<=0.1, 0.1<a<0.8, a>=0.8},a3:{a=0(不是),a=1(是)}。
2、获取训练样本
这里使用运维人员曾经人工检测过的1万个账号作为训练样本。
3、计算训练样本中每个类别的频率
用训练样本中真实账号和不真实账号数量分别除以一万,得到:
4、计算每个类别条件下各个特征属性划分的频率
5、使用分类器进行鉴别
下面我们使用上面训练得到的分类器鉴别一个账号,这个账号使用非真实头像,日志数量与注册天数的比率为0.1,好友数与注册天数的比率为0.2。
可以看到,虽然这个用户没有使用真实头像,但是通过分类器的鉴别,更倾向于将此账号归入真实账号类别。这个例子也展示了当特征属性充分多时,朴素贝叶斯分类对个别属性的抗干扰性。
- 贝叶斯分类器,最小二乘
- 【目标跟踪: 相关滤波器 二】岭回归(正则化最小二乘分类器)
- 最小二乘回归树 属性选择比率 gbdt基分类器 java
- 梯度及最小二乘估计器
- 说说最小二乘
- 最小二乘拟合
- 最小二乘
- 最小二乘拟合
- 最小二乘问题
- 最小二乘回归
- 最小二乘C
- 最小二乘拟合
- 最小二乘
- 最小二乘
- 最小二乘GAN
- 线性最小二乘
- 非线性最小二乘
- 最小二乘回归
- NSRunLoop详细解释分析
- Ubuntu 14.04/14.10下安装VMware Workstation 11图文教程
- android图片轮播第一弹_异步获取和本地获取图片_轻量级可集成到项目中型
- 求助!~~
- 真正的爱情,是他为你改变自我,是妥协和容忍
- 贝叶斯分类器,最小二乘
- redis数据类型 - set类型
- scala 数组Array排序,转换字符串,过滤 quickSort,mkString,yield,filter,map
- plsql 导入excel文件和txt文件
- vc++加载透明png图片方法——GDI+和CImage两种
- 自绘贴图-MFC方式
- SpringMVC中,前台jsp封装参数,绑定参数,传递参数到后台controller的过程详解
- Masonry框架
- 怎样运用EDIUS中的色彩平衡滤镜较色