概率图模型（PGM）学习笔记（三）模式推断与概率图流

来源：互联网发布：2016年网络犯罪案例编辑：程序博客网时间：2024/04/29 01:21

我们依然使用“学生网络”作为例子，如图1。

图1

首先给出因果推断（Causal Reasoning）的直觉解释。

可以算出来

$P\left({{l^1}} \right) \approx 0.5$

即学生获得好的推荐信的概率大约是0.5.

但如果我们知道了学生的智商比较低，那么拿到好推荐信的概率就下降了：

$P\left({{l^1}\left| {{i^0}} \right.} \right) \approx 0.39$

进一步，如果又同时知道了考试的难度很低，那么他拿到好的推荐信得概率又上升了，甚至还能超过最初的概率：

$P\left({{l^1}\left| {{i^0},{d^0}} \right.} \right) \approx 0.51$

上述这个过程就是因果推断，你看它是顺着箭头的方向进行推断。

其次给出信度推断（Evidential Reasoning）的直觉解释。如图2.

图2

本来已知考试难度高和学生很聪明的概率分别为0.4和0.3

$\begin{array}{l}P\left({{d^1}} \right) = 0.4\\P\left({{i^1}} \right) = 0.3\end{array}$

现在我们忽然知道这个悲剧的同学考试里得了C等。

那么现在考试难度高的概率就上升了，学生很聪明的概率就下降了：

$\begin{array}{l}P\left({{d^1}\left| {{g^3}} \right.} \right) \approx 0.63\\P\left({{i^1}\left| {{g^3}} \right.} \right) \approx 0.08\end{array}$

上述这个过程就是信度推断，你看它是逆着箭头方向进行推断的。

再次给出交叉因果推断（Intercausal Reasoning）的直觉解释，如图3.

图3

信度推断指出，在已知该同学考了C等之后，他很聪明的概率下降到0.08了，

如果此时我们又知道这次考试很难，那么他很聪明的概率会有一个轻微的上升，到0.11：

$P\left({{i^1}\left| {{g^3},{d^1}} \right.} \right) \approx 0.11$

交叉因果推断的特点是Difficulty顺着箭头到了Grade，又逆着箭头影响到了Intelligence.

为什么会这样？我们考虑一个最简单的情况，如图4.

图4

一开始可以看到，X1和X2是完全独立的，同时有若已知Y=1

$P\left({{X_1} = 1} \right) = P\left( {{X_2} = 1} \right) = \frac{2}{3}$

然而，当我们已知X1=1之后，X2=1的概率下降了：

$P\left({{X_1} = 1} \right) = \frac{1}{2}$

再来看看这个同学考了B是什么效果，如图5.

图5

本来学生很聪明的概率是0.3，后来知道了他考了B，那么他很聪明的概率下降到了0.175.

现在又知道了，这门考试其实蛮难的。那么他很聪明的概率又上升到了0.34，居然超过了原始的0.3.

现在再考虑一个情况：这个同学在SAT测验中得了A，如图6.

图6

这对考试很难以及学生很聪明的概率有什么影响吗？回到那位考了C的悲剧同学。

这个同学考了C，所以考试很难的概率为0.63，学生很聪明的概率降到0.08

现在，忽然又知道了这个同学蛮厉害的，在SAT中考了A

于是，考试很难的概率达到了0.76，学生很聪明的概率达到了0.58，两者都大大超过了他们本来的概率。这是因为，同学的SAT成绩为A改变了我们对其智商的认识，从而影响到了在他考了C时，对其考试难度的认识。

通过上述直观分析，我们发现概率图中的节点是能够相互影响的，下面做具体分析。如图7.

图7

设随机变量X和Y，在什么情况下是可以相互影响的呢？

1.X与Y直接相连时他们可以相互影响。

比如告诉你考试很简单，那么你得分高的概率自然上升。告诉你得了C，那么考试很简单的概率就会下降。

2.X与Y中间隔了一个W，在连接箭头方向不变的情况下，X与Y能够相互影响。

比如告诉你这个同学得到了一封不错的推荐信，那么考试简单的概率就上升了。告诉你考试难度很大，那么他能得到好推荐信的概率就下降了。

3.X与Y之间隔了一个W，如果其中箭头是指向外的方向，X与Y能够相互影响。

比如同学的SAT成绩显然和他的Grade是相互影响的。这就像一个人每次模拟考试都能拿高分，我们自然有理由相信他能力很强，足以在高考中获得好成绩。

4.X与Y之间隔了一个W，如果其中箭头是指向内的方向，那么X与Y就不能相互影响了。

比如告诉你考试很难，但这跟同学的智商有什么关系呢？反之亦然。

总之，如果一条关系链 ${X_1} - \ldots {X_m}$ 中没有形如 ${X_{i - 1}} \to {X_i}\leftarrow {X_{i + 1}}$ 的结构，那么这条关系链就能把影响传递下去。

以上讨论的都是我们对中间环节W一无所知的情况。

如果我们知道关于中间环节W的信息呢，X与Y之间的相互影响是否会因此而发生改变呢？我们用Z集合表示我们知道相关信息的意思。如图8.

图8

分栏左侧就是我们上面讨论的情况：我们对W一无所知。

右边栏是指我们已经知道W的概率了。再来观测X与Y之间的影响。

神奇的事情出现了：如果我们知道了W的概率，会把之前通畅的关系链给打断了；而把之前堵塞的关系链打通了。

具体地：同学SAT得了A，但是我们已知这个同学智商其实超级笨，那么他考试拿高分的概率会因为他SAT的狗屎运而增多吗？不会的，根据定义，考试成绩只与他的智商和考试难度有关，跟他碰巧考好的SAT没有任何关系。因为我们已经知道他实际上很笨了，SAT不过是个意外。

而之前堵塞的链接现在却通了。比如说考试很难，这和同学智商没有任何关系，但是如果我知道了考试很难，同学考了A，那么我们非常有理由相信，同学应该很聪明啦。

这张图中，S-I-G-D这条路径在I不知道、G知道的情况下才能通畅无阻。

Tips：其实这个结论还应该扩展一下。

已知试卷很难，不知道考了多少分，但是我们知道这个同学利用这个分数拿到了一封很好的推荐信，我们就有理由相信，他应该考得不错，进而相信他应该是个挺聪明的童鞋。

总之。如果一条关系链 ${X_1} - \ldots {X_m}$ 中在每个形如 ${X_{i - 1}} \to {X_i}\leftarrow {X_{i + 1}}$ 的结构里，我们知道Xi或者至少知道他的某一个子节点的概率（就像我们虽然不知道Grade，但是我们知道了Letter的概率），那么这条关系链就能把影响传递下去。

独立性

独立性的定义可以有以下3种描述：

$\begin{array}{l}P\left({X,Y} \right) = P\left( X \right)P\left( Y \right)\\P\left({X\left| Y \right.} \right) = P\left( X \right)\\P\left({Y\left| X \right.} \right) = P\left( Y \right)\end{array}$

类似地，条件独立也可以这么写

$\begin{array}{l}P\left({X,Y\left| Z \right.} \right) = P\left( {X\left| Z \right.} \right)P\left({Y\left| Z \right.} \right)\\P\left({X\left| {Y,Z} \right.} \right) = P\left( {X\left| Z \right.} \right)\\P\left({Y\left| {X,Z} \right.} \right) = P\left( {Y\left| Z \right.} \right)\\P\left({X,Y,Z} \right) \propto {\phi _1}\left( {X,Z} \right)\phi \left( {Y,Z} \right)\end{array}$

下面直观感受一下条件独立性，如图9

图9

有2枚硬币，一只均匀，另一只不均匀而且又90%的概率能正面朝上。当然，两枚硬币外观是完全一样的。

现在让你抽出一枚，准备扔2次。

你先扔了第一次，发现正面朝上，那么可以相信，第二次还是正面朝上的概率肯定增加了，这样第二次投硬币的结果受到了第一次投硬币的影响。

而我现在告诉你其实你刚刚投的是均匀硬币（或者不均匀，无所谓的），那么你第二次投硬币的概率和第一次投出来的结果就失去了联系。

这就说明了条件有时会使变量之间的相关性丧失。

欢迎参与讨论并关注本博客和微博以及知乎个人主页，后续内容继续更新哦~

转载请您尊重作者的劳动，完整保留上述文字以及本文链接，谢谢您的支持！

3 0