程序博客网 > 网络拓扑自动发现

贝叶斯分类分类算法

来源：互联网发布：网络拓扑自动发现编辑：程序博客网时间：2024/05/16 02:05

•朴素贝叶斯分类的工作过程如下：

•(1) 每个数据样本用一个n维特征向量X= {x1，x2，……，xn}表示，分别描述对n个属性A1，A2，……，An样本的n个度量。

•(2) 假定有m个类C1，C2，…，Cm，给定一个未知的数据样本X（即没有类标号），分类器将预测X属于具有最高后验概率（条件X下）的类。也就是说，朴素贝叶斯分类将未知的样本分配给类Ci（1≤i≤m）当且仅当P(Ci|X)>P(Cj|X)，对任意的j=1，2，…，m，j≠i。这样，最大化P(Ci|X)。其P(Ci|X)最大的类Ci称为最大后验假定。根据贝叶斯定理

•(3) 由于P(X)对于所有类为常数，只需要P(X|Ci)*P(Ci)最大即可。如果Ci类的先验概率未知，则通常假定这些类是等概率的，即P(C1)=P(C2)=…=P(Cm)，因此问题就转换为对P(X|Ci)的最大化（P(X|Ci)常被称为给定Ci时数据X的似然度，而使P(X|Ci)最大的假设Ci称为最大似然假设）。

•否则，需要最大化P(X|Ci)*P(Ci)。注意，类的先验概率可以用P(Ci)=si/s计算，其中si是类Ci中的训练样本数，而s是训练样本总数。

•(4) 给定具有许多属性的数据集，计算P(X|Ci)的开销可能非常大。为降低计算P(X|Ci)的开销，可以做类条件独立的朴素假定。

•给定样本的类标号，假定属性值相互条件独立，即在属性间，不存在依赖关系。这样

联合概率分布

•(5) 对未知样本X分类，也就是对每个类Ci，计算P(X|Ci)*P(Ci)。

•样本X被指派到类Ci，当且仅当P(Ci|X)> P(Cj|X)，1≤j≤m，j≠i，换言之，X被指派到其P(X|Ci)*P(Ci)最大的类。

贝叶斯分类

全概率公式

贝叶斯公式

•Bayes公式，其意义是：假设导致事件A发生的“原因”有Bi(i=1,2,…,n)个。它们互不相容。

•现已知事件A确已经发生了，若要估计它是由“原因”Bi所导致的概率，则可用Bayes公式求出.即可从结果分析原因.

Bayesian Classifiers

•Approach:

–compute the posterior probability P(C | A1, A2, …, An) for all values of C using the Bayes theorem

–

–

–Choose value of C that maximizes
P(C | A1, A2, …, An)

–Equivalent to choosing value of C that maximizes
P(A1, A2, …, An|C) P(C)

•How to estimate P(A1, A2, …, An| C )?

Naïve Bayes Classifier

•Assume independence among attributes Ai when class is given:

–P(A1, A2, …, An |C) = P(A1| Cj) P(A2| Cj)… P(An| Cj)

0

–Can estimate P(Ai| Cj) for all Ai and Cj.

–New point is classified to Cj if P(Cj) P P(Ai| Cj) is maximal.

网络拓扑自动发现

网络拓扑自动发现

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子资源网武汉人力资源人力资本人力资源专业就业方向长沙人力资源吴江人力资源网上海人力资源网企业人力资源管理昆山人力资源网人力咨询公司大连人力资源人力资源平台人力资源是做什么的人力管理系统人力资源机构郑州市人力资源武进人力资源网佛山人力资源网北京人力资源网中山人力资源网人力资源管理专业就业前景人力资源法务师含金量长沙人力资源网人力资源报考南通人力资源网人力资源信息网人力资源学校人力资源三级考试报名人力资源三级报考费用人力资源三级证人力资源报名条件人力资源经理人力资源开发什么是人力资源管理 2016人力资源管理师报名时间河南人力资源网舟山人力资源网人力资源二级报名时间胶州人力资源人力资源三级条件江苏人力资源网