D-separation 2013/4/21 0:59

来源:互联网 发布:tcp多线程网络编程 编辑:程序博客网 时间:2024/04/30 01:42

这是一张有向图,表示不同节点之间相互的影响关系,例如:Difficulty和intelligence共同影响grade,物理意义就是课程的困难程度和学生的智商共同决定了学生的分数,其他关系皆类似。

从上图我们可以看出,节点间可能不是独立的,不独立的节点对可能有以下几种情况:

1.A->B  例如:Intelligence->SAT   AB不独立

2.B->A 例如:SAT->Intelligence   BA不独立

3.A<-C->B 例如: Grade<-Intelligence->SAT   AC,BC,AB皆不独立,其中AB的一种极端情况被称作explaining away

4.A->B<-C 例如: Difficulty->Grade<-Intelligence  AC独立,BC,AB不独立


以上都是显而易见的,现在我们看看如果我们可以观察到某些节点取值时的依赖的情况会有什么变化,即条件分布下的独立性:

现在考虑1.2.是没有意义的,变量数目都不够。

情况3下,若A或B可被观察,类似于情况1,可从A或B的状态推测C的状态进而推测B或A;若是C可被观察,则A,B独立,因为之前的推断链在C处被截断了。

情况4下,若B可观察,则AC不独立


现在引入D-separation的概念

D-separation中有3个无交集的节点集--X,Y,Z,所谓‘X,Y在图G中给定Z的情况下是D-separation的’即,在图G中,在Z可被观察的情况下,X的任何元素皆与Y中的元素相互独立。

如何检查上述条件是否成立呢,关键就在上文中的情况3,4部分,这里直接引用很广泛传播也很拗口的3个条件:

         1)且路径上的两条弧都以z为尾时,z在Z中
   2)路径上的一条弧以z为头、一条以z为尾时,z在Z中
   3)路径上的两条弧都以z为头时,z和它的任何后继都不在Z中

其实1)就是对应上文中的情况1、2;2)对应情况3中AB独立的条件;3)对应情况4中AC独立的条件;


下面再引入一个概念:I(G),I(G)={(X|_Y|Z):d-sep_G(X,Y|Z)},即图G中全部条件独立的集合。

而所谓I-map,就是若联合概率分布P满足了I(G)(即图G全部的条件独立)则,G是P的一个I-map(indepandency map)


绕了这么多圈引入这么多概念是为了什么呢?下面再引入一个概念:

factorization:图G可以用联合概率分布P来表示


而factorization和I-map是等价的,即满足I-map的G,P必然满足factorzation。故而D-separation,I-map这一系列概念的引入实际上就是为了求解可以给定的图G可以用哪些联合概率分布表示。I-map就是factorization的数学化表示方法,同时也为求解提供了一种数学上的规范形式。

原创粉丝点击