Dempster-Shafer Evidence Theory

来源：互联网发布：胶南网络推广招聘信息编辑：程序博客网时间：2024/06/07 14:13

Dempster–Shafer theory

本文参考书Wikipedia中的 Dempster-Shafer thoery 原文链接：点击打开链接

同时还参考了浙江大学计算机学院人工智能系 徐从富 教授的《人工智能》课件。

在这里特别感谢！

一、 DS证据理论概述

核心： Dempster合成规则——将多个主体（可以是不同的人的预测、不同的传感器的数据、不同的分类器的输出结果等等）相融合

优点： 1、所需要的先验数据比概率推理理论中更直观、更容易获得（不知道为什么）；满足比Bayes概率理论更弱的条件，即 “不必满足概率可加性”

2、可以融合多种数据和知识（正如核心中所述）

3、具有直接表达 “不确定” 和 “不知道” 的能力，这些信息表示在mass函数中，并在证据合成过程中保留了这些信息（还没有理解感受到）。

缺点： 1、证据必须是独立的

2、证据合成规则没有非常坚固的理论支持，其合理性和有效性还存在较大的争议

3、计算上存在“指数爆炸问题”

4、在某些情况下得到的结果违背常理，如“Zadeh悖论”，具体见下面的例子

二、 DS证据理论基本概念

我们先来假设这样一个情景，有一个传感器探测一个很远处的一道光，这道光只能发出 {red, yellow, green}这三种中的一种光。传感器对所探测的光做出分析，形成了一些假设这道光可能是{Null, Red, Yellow, Green, Red or Yellow, Red or Green, Yellow or Green, Any}，以及这些假设相应的可能性（也就是说Mass）。那么，DS证据理论是干啥呢，我感觉就是根据这个传感器提供的各个假设的信息，得到针对每一个假设的可信度区间。需要注意的是，这里的Red or Yellow并不是P(Red) + P(Yellow), 而是Red or Yellow 这一假设的概率（其实我也还没太搞懂这之间的区别，只是感觉上应该不一样）。

这里先给出这一场景的所有信息表：

HypothesisMassBeliefPlausibilityNull000Red0.350.350.56Yellow0.250.250.45Green0.150.150.34Red or Yellow0.060.660.85Red or Green0.050.550.75Yellow or Green0.040.440.65Any0.11.01.0

OK，根据上面的例子，我们就来定义一下DS证据理论中的基本概念。

1. 首先我们设X全域（Universe）：也就是指的上面那道光可能发出的颜色，即X = {Red, Yellow, Green}

对于X全域，我们一共可以有多少种假设呢？很显然，就是

个啦（包括空集

），这个叫做识别框架，或者是假设空间。

比如说：

则

对于我们的例子X = {Red, Yellow, Green}，

={Null, Red, Yellow, Green, Red or Yellow, Red or Green, Yellow or Green, Any}

2. DS证据理论针对识别框架中的每一个假设都分配了概率，我们称为基本概率分配（BPA, Basic Probability Assignment）或者是基本置信分配 (BBA, Basic Belief Assignment )。这个分配函数我们称为mass函数。

1）公式为：

，每个假设的mass函数值（概率（probability）或者是置信度（belief）值）都在0和1之间；

2）同时，空集

的mass函数值为 0，即

另外其他的假设mass值得和为1，即

,A 为所包含的假设。

3）其中，使得mass值大于0的假设 A称为焦元(Focal element)

在我们上面的例子中，Column 2 即为mass函数针对各个假设的值，m(Null) = 0, m(Red) + m(Yellow) + m(Green) + ... + m(Any) = 1 根据该列我们可以得到满足上面的定义。

3. 下面我们要根据mass函数来计算每一个假设的 信度函数 (Belief function) 以及 似然函数 （Plausibility function）

得到的信度函数和似然函数就是这个假设A 的概率范围了：

1）信度函数的定义如下：

该公式表示，对于假设A ，它的信度函数为所有真属于A 的假设，即 B ，的mass值的和。

以上面的例子来讲，A假设为 Red，那么它的 Bel 函数值就是0.35，因为只有它本身是属于假设A 。

但是，如果假设A 为 Red or Yellow, 那么它的 Bel 函数值就不是0.06了，而是 m(Null) + m(Red) + m(Yellow) + m(Red or Yellow) = 0 + 0.35 + 0.25 + 0.06 = 0.66

2) 似然函数的定义如下：

该公式表示，对于假设A，它的似然函数为所有与 A 相交不为空的假设 B 的mass值的和。

以上面的例子来讲，还是 A假设为 Red，那么它的 pl 函数值为 m(Red) + m(Red or Yellow) + m(Red or Green) + m(Any) = 0.35 + 0.06 + 0.05 + 0.1 =0.56

3）信任区间

根据上面的信度函数和似然函数，对于一个识别框架中的某个假设A ，我们可以根据其基本概率分配的mass函数来计算A 的 Bel(A) 及Pl(A)。那么，由信任函数与似然函数组成的闭区间[Bel(A),Pl(A)]则为假设 A的信任区间，表示对假设 A 的确认程度。

三、 Dempster合成规则

前面所述的都是只有一个主体（subject）对一个识别框架预测。而Dempster合成规则正是用来将多个主体的输出结果相结合的关键步骤。

两个主体的mass函数 m1 和 m2 有：

其中

等价于

合成规则为两个mass函数 m1 和 m2, 对于假设A的合成结果等于两个主体的假设中，所有相交为A 的假设的mass函数值的乘积的和，再除以一个归一化系数 1-K。归一化系数 1-K中的 K 的含义是证据之间的冲突（the conflict between the evidences, called conflict probability）(并不太明白为何能够表现证据之间的冲突，从公式上来看就是两个主体提供的证据不同的时候（B与C相交为了空集）的mass函数值乘积)。

举个“栗子”：

一宗谋杀案有三个犯罪嫌疑人 U = {Peter, Paul, Mary}, 两个目击证人分别指证犯罪嫌疑人，得到两个mass函数m1 和 m2.