《人工智能教程（张仰森）》（二）

来源：互联网发布：程序员数学编辑：程序博客网时间：2024/05/01 03:32

三、确定性推理方法

按照推理过程所用知识的确定性，推理可分为确定性推理和不确定性推理。自然演绎推理和归结推理是经典的确定性推理。

1. 推理概述

首先谈了推理的基本概念。还是涉及到推理机、综合数据库和知识库的流程。

然后是推理的方法及其分类。

1）按照推理的逻辑基础分为演绎推理（由一般到个别，最常用的是三段论）、归纳推理（由个别到一般，最常用的是数学归纳法）和默认推理（在知识不完备的情况下假设某些条件已经具备）。演绎推理不能增殖新的知识，而归纳推理即归结推理能产生新的知识。现实中往往是两者并用。

2）按照所用知识的确定性分为确定性推理和不确定性推理。

3）按照推理过程的单调性分为单调推理（所得结论会越来越接近于最终目标）和不单调推理（会出现结论否定和退回，在知识不完全时发生，现实中常见）。

接下来说了推理的控制策略。按照推理方向，推理方式可分为

1）正向推理。

2）反向推理。初始目标的选取一般有两种方法：由用户指定目标和智能系统自助选择。在诊断性专家系统中较为有效。

3）混合推理。把正向推理和反向推理结合起来使用，又可分为先正向后反向的混合推理和先反向后正向的混合推理。它适用的场合是：已知事实不够充分；由正向推理推出的结论可信度不高；希望得出更多的结论。

4）双向推理。指正向推理和反向推理同时进行，在中间的某一步骤汇合而结束。整个推理过程中，两种推理算法依据一定的控制策略交替执行。

最后谈了推理的冲突消解策略。基本思想是对匹配的知识或规则进行排序，以决定匹配规则的优先级别。常用的排序方法有：

1）按就近原则排序。把知识最近使用过的排在前面。

2）按知识特殊性排序。具有特殊性的知识（一般是前提条件更多）排在前面。

3）按上下文限制排序。根据与上下文的匹配情况。

4）按知识的新鲜性排序。赋予新鲜知识更高的优先级。

5）按知识的差异性排序。为与上一次使用过的知识差别大的知识赋予更高的优先级。

6）按领域问题的特点排序。

7）按规则的次序排序。根据知识库中已有规则排列顺序。

8）按前提条件的规模排序。前提条件少的知识具有更高优先级。

2. 命题逻辑

谓词逻辑是在命题逻辑的基础上发展起来的，命题逻辑可看做是谓词逻辑的一种特殊形式。

首先谈了命题。给出了两个定义：一是能够分辨真假的语句称为命题；二是原子命题是命题中最基本的单位。一般情况只有陈述句才能是命题。但并不是所有的陈述句都是命题。通常用大写字母表示命题，又可分为命题常量和命题变量。

最后谈了命题公式。给出了几个连接词，其中<—>表示“双条件”，P<—>Q表示“P当且仅当Q”。接着又给出了命题公式的定义，连接词的优先级别次序依次是：非、合取、析取、蕴含、双条件。命题逻辑无法把所描述的客观事物的结构及逻辑特征反映出来，也不能把不同事物的共同特征表示出来。

3. 谓词逻辑

首先谈了谓词与个体。在谓词逻辑中，将原子命题分解为谓词和个体两部分。一个谓词以一个个体相关联称为一元谓词，刻画了个体的性质；一个谓词与多个个体相关联，称为多元谓词，刻画了个体间的关系。谓词的一般形式是：P（x1, x2, ..., xn），其中P是谓词一般大写，xi是个体一般小写。个体可以是常量、变量或函数，但统称为项。谓词中包含的个体数目称为谓词的元数。还有一阶谓词和二阶谓词的概念，个体变元的取值范围称为个体域，可以是有限的也可以是无限的。

然后谈了谓词公式。分别给出了连接词、量词、原子、合式公式、量词辖域（位于量词后面的单个谓词或用括号括起来的合式公式）、约束变元（在辖域内与量词中同名的变元）、自由变元（不受约束的变元）。

还谈了谓词公式的永真性和可满足性。先给出了解释的定义，指出一般情况下谓词公式的真值都是针对某一解释而言的。接着给出了永真性和永假性（不可满足性或不相容性）的定义。对于谓词公式P，如果至少存在一个解释使得公式P在此解释下的真值为T，则称公式P是可满足的。

接着谈了谓词公式的等价性与永真蕴含。给出了谓词等价的概念P<=>Q，还有一些常用的等价式：交换律、结合律、分配律、狄摩根定律、否定之否定定律、吸收率、补余律、逆否定率、连接词化定律、量词转换率、量词分配律。给出了永真蕴含P—>Q，还有一些常用的永真蕴含式：化简式、附加式、析取三段论、假言推理、拒取式、假言三段论、二难推论、全称固化、存在固化。除此之外的一些推理规则有：P规则、T规则、CP规则、反证法。

最后谈了置换与合一。在进行知识模式的匹配时，根据两模式的相似程度分为确定性匹配和不确定性匹配。基于谓词逻辑的归结推理方法是一种确定性的推理方法，也是一种确定性的匹配。先给出了置换的定义：形如{t1/x1，t2/x2，...，tn/xn}的一个有限集，空置换以ε表示。置换乘法是将两个置换合称为一个置换。置换具有结合律，除空置换外，置换不具有交换律。最后谈了合一置换和最一般合一置换（mgu，不唯一）。通过不一致集（两个谓词公式的项从左到右进行比较，那么不相同的项所狗成的集合）的概念引出了求最一般合一置换的算法。

这一级的内容和离散数学中的内容有很大的联系。

4. 自然演绎推理方法

首先给出了自然演绎推理的概念。它是从一组已知为真的事实出发，直接运用命题逻辑或谓词逻辑中的推理规则推出结论的过程。

然后谈了利用演绎推理解决问题。一定要避免的两种错误：一是肯定后件的错误，二是否定前件的错误。

最后谈到了演绎推理的特点。演绎推理所推导出的结论总是蕴含在一般性知识的前提中，它不能增殖新的知识。优点是符合人的思维习惯，缺点是容易产生知识或规则的组合爆炸，即推理过程中得到的中间结果数量可能会按指数增长。

5. 归结推理

首先谈了谓词公式与子句集。先提出了范式的概念，谈到了两种范式：一是前束型范式（所有量词均非否定地出现在公式的最前面，其辖域一直延伸到公式之末，且不出现连接词—>和<—>），二是Skolem范式（从前束型范式中消去全部存在量词所得到的公式）。给出了将谓词公式化为Skolem标准型的步骤。

1）消去蕴含和双条件符号。

2）减少否定符号的辖域，使其最多只作用到一个谓词上。

3）重新命名，使所有变元名字均不同。

4）消去存在量词。分两种情况。

5）把全称量词全部移到公式的左边。

6）将母式化为合取范式。

还谈了子句和子句集，以及谓词公式G与其子句集S在不可满足的意义上是一致的。因此为了证明一个谓词公式G是不可满足的，只要证明其相应的子句集S是不可满足的就可以了，也就是接下来要做的工作了。

接下来就谈到了Herbrand理论。构造了一个特殊域（称为Herbrand域或H域），只要对H域上的所有解释进行判定，就可得知谓词公式是否是不可满足的。还谈了原子集和H域上的解释（涉及到的定理较多，不再赘述）。Herbrand定理知识从理论上给出证明子句集不可满足的可行性及方法，但在计算机上实现其证明过程却是十分困难的。随后Robinson提出了归结原理，是对自动推理的重大突破，使机器定理证明变成现实。

于是就谈到了归结原理。又称消解原理，证明子句集不可满足性。基本思想是：检查子句集S中是否有空子句，若有，则表明S是不可满足的；若没有，就在子句集中选择合适的子句对其进行归结推理，如果能推出空子句，就说明子句集是不可满足的。随后分别谈了命题逻辑中的归结原理、一阶谓词逻辑中的归结原理以及归结原理的完备性。

之后谈了用归结原理进行定律证明。

1）首先要否定结论，将否定后的结论与前提公式集组成谓词公式G。

2）求谓词公式G的子句集。

3）应用归结原理证明子句集S的不可满足性，从而证明谓词公式G的不可满足性。这就说明对结论的否定是错误的，推断出定理的成立。

最后说了应用归结原理进行问题求解。

6. 归结过程的控制策略

首先谈了引入控制策略。由于采用盲目的归结策略，产生了大量无用的归结式，造成了极大的浪费，所以要引入控制策略。归结策略可分为两类：一是删除策略（删除某些无用的子句来缩小归结的范围），二是限制策略（通过对参加归结的子句进行种种限制，尽可能减少归结的盲目性）。

然后就是归结控制策略及其应用举例。先是删除策略，包括：

1）纯文字删除法。如果文字L出现在S中，而~L不出现在S中，便说L为S的纯文字，应删除。

2）重言式删除法。如果一个子句中同时包含互补文字时，称该子句为重言式。取值永真，应删除。

3）包孕删除法。设有子句C1和C2，如果存在一个替换σ，使得C1σ∈C2，则称C1包孕于C2。可从子句集中删去那些被包孕的字句。

归结策略包括:

1）线性归结策略。从子句集中选取一个顶子句C0开始作归结，每次归结操作都用到上次归结结论的子句。

2）单文字（单元）归结策略。如果一个子句只包含一个文字，则称该子句为单文字子句。在归结过程中每次归结都有一个子句是单文字子句，则称这种归结就是单文字归结。即要求参加归结的两个子句中至少有一个是单文字子句。但这种归结策略是不完备的。

3）输入归结策略。要求参加归结的两个子句中，必须至少有一个子句是初始子句集中的子句。这种归结策略也是不完备的，但是具有简单高效的优点。

4）支持集策略。要求每一次归结时，参加归结的两个子句中至少有一个是由目标公式的否定所得到的子句，或者是它们的后裔。

四、不确定性推理方法

1. 不确定推理概述

首先谈了不确定性推理的概念。一个人工智能系统由总数据库、知识库和推理机构成。其中知识库是核心。

然后谈了不确定推理方法的分类。

1）模型方法。分为数值方法（分为基于概率的方法和模糊推理方法）和非数值方法（包括逻辑法等）两类。

2）控制方法。控制策略的选择和研究是关键。如启发式搜索、相关性制导回溯等。

最后谈了不确定推理中的基本问题。

1）不确定性的表示。分为证据不确定性和知识不确定性。

2）推理计算。需要解决不确定性传递问题、证据不确定性的合成问题、结论不确定性的合成问题。

3）不确定性的量度。

2. 可信度方法

它是不确定性推理方法中应用最早且简单有效的方法之一。

首先谈了可信度的概念。可信度也可以称为确定性因子。

然后谈了知识不确定性的表示。知识是以产生式规则的形式表示的，知识的不确定性则是以可信度CF(H,E) 表示的，一般形式是 IF E THEN H (CF(H,E))。CF（H,E）称为可信度因子或规则强度。在专家系统中，CF(H,E) = MB(H,E) - MD(H,E)，其中 MB(Measure Belief) 为信任增长度，表示因与前提条件E匹配的证据出现，使结论H为真的信任增长度。MD(Measure Disbelief) 为不信任增长度，表示因与前提条件E匹配的证据出现，对结论H为真的不信任增长度。MB(H,E) 与MD(H,E) 是互斥的，值域都为[0，1]。当MB(H,E) >0 时，MD(H,E) = 0，当MD(H,E) > 0 时，MB(H,E) = 0。所以CF(H,E)的取值范围是 [-1,1]。

接着就谈了证据不确定性的表示。

1）单个证据的不确定性获取方法。初始证据可信度由用户指定，推出结论可信度由不确定性传递算法计算得到。

2）组合证据的不确定性的获取方法。当证据是多个单一证据的合取时，取所有单一置信度里的最小值；当时析取时，取最大值。

还有不确定性的推理计算。

1）只有单条知识支持结论时，结论可信度的计算方法。计算公式为CF(H) = CF(H,E) × max{ 0, CF(E) }，没有考虑证据为假时对结论H所产生的影响。

2）多条知识支持同一结论时，结论不确定性的合成计算方法。先计算每条知识的结论可信度，然后根据公式计算综合可信度。

3）在已知结论原始可信度的情况下，结论可信度的更新计算方法。即已知CF(H,E)和CF(H)，求CF(H/E)，根据CF(E)的区间有不同的公式。

最后说了可信度方法应用举例。介绍了前面的两种方法：合成法和更新法。

3. 主观Bayes方法

又称主观概率论。是一种基于概率逻辑的方法。

首先谈了基本Bayes公式。并通过几个例子进行了说明。但是贝叶斯公式要求条件相互独立，并且先验概率和证据的条件概率很难得到保证。

然后又谈了主观Bayes方法及其推理网络。推理网络是把所有规则知识连接成一个有向图，图中各节点代表假设结论，弧代表规则，每一条弧与两个数值（LS, LN）联系，LS表现规则成立的充分性，用于指出证据E对结论H为真的支持程度；LN表现规则成立的必要性，用于指出E对结论H为真的必要性程度。他们的取值范围是[0，1)，由领域专家给出具体值。

接下来谈了知识不确定性的表示。知识就是推理网络中的一条弧，它的不确定性是以一个数值（LS,LN）来进行描述的。

还有证据不确定性的表示。对于单个证据不确定性的表示，将后验概率P(E/S)和C(E/S)的关系规定为分段线性插值关系。对于组合证据不确定性的表示方法，如果是多个单一证据的合取，还是取所有里面的最小值，析取时取最大值。

又谈了不确定性的推理计算。

1）确定性证据。分别讨论了证据肯定出现的情况、证据肯定不出现的情况以及关于知识规则强度（LS,LN）的意义讨论。

2）不确定性证据。分别讨论了用概率表示证据的不确定性，用可信度表示证据的不确定性。

还有结论不确定性的合成与更新算法。

最后给出了主观Bayes方法应用举例。

4. 证据理论

又称D-S理论，能区分“不确定”与“不知道”的差异。

首先谈了D-S理论的数学基础。证据理论是用集合来表示命题的，在D-S理论中，知识是用产生式表示的，其不确定性通过一个集合形式的“可信度因子”来表示，证据和结论是用集合表示的，其不确定性是用信任函数和似然函数来表示的。之后分别介绍了

1）概率分配函数：作用是把样本空间D上的任意一个子集A都映射为[0,1]上的一个数M(A)，当A对应一个命题时，M(A)则是对相应命题不确定性的度量。各子集的概率分配数并不是概率。

2）信任函数：又称下限函数，用Bel(A)来表示命题A为真的信任程度。

3）似然函数：又称上限函数，用Pl(A) = 1 - Bel(~A) 表示命题A不为假的信任程度。Pl(A) - Bel(A) 表示既不为真也不为假的情况，即“不知道”。对命题A，用区间（Bel(A), Pl(A)）来描述A的不确定性，并把Bel(A)和Pl(A)作为度量其信任程度的下限和上限。

4）概率分配函数的正交和。如果遇到了几个不同的概率分配函数，则可用概率分配函数的正交和运算将它们合并成一个概率分配函数。

然后谈了特定概率分配函数。定义了只有单个元素构成的子集和样本空间D本身的基本概率数有可能大于0，其他子集的基本概率数均为0。对D中的任意子集A和B，都有Pl(A) - Bel(A) = Pl(B) - Bel(B) = M(D)。

于是接着谈了基于特定概率分配函数的不确定性推理模型。先给出了信任度函数用来度量命题的不确定性，使该函数的值落在区间（Bel(A), Pl(A)）内，函数定义是 f(A) = Bel(A) +( |A| / |D| )×[ Pl(A) - Bel(A) ]。

1）证据不确定性的表示。用信任度函数 f(E) 表示。初始简单证据时由用户给出，推理所得结论作证据时由推理计算得到。合取组合证据取最小值，析取组合证据取最大值。

2）知识不确定性的表示。用产生式规则表示：IF E THEN H={h1,...,hn} CF={c1,...,cn}，其中 ci 用来指出 hi 的可信度。

3）不确定性的传递推理计算方法。把证据的不确定性和知识的不确定性传递给结论H，步骤是先求出H的概率分配函数，然后求出H的信任函数Bel(H)和释然函数Pl(H)，最后求结论H的信任度f(H)。

最后谈了证据理论解题举例。

5. 模糊理论

模糊推理的理论基础是模糊集理论和在此基础上发展起来的模糊逻辑，它所处理的对象本身就是模糊的。

首先谈了模糊集理论与模糊逻辑。模糊集与隶属函数是一一对应的，模糊集中的元素实际上就是论域中各元素的隶属函数值，因此隶属函数的构建是建立模糊集的关键。隶属函数主要把论域中的元素映射到[0,1]区间。模糊集的表示方法又可分为论语是离散的还是连续的两种。还谈到了模糊集的运算，包括A等于B，A包含于B，A与B的并集（取最大），A与B的交集（取最小），A的补集。之后谈到了模糊关系及模糊关系的合成，还有模糊变换的概念。

然后谈了模糊知识的表示。提出了模糊命题的概念，又说明了模糊知识的表示：模糊产生式规则，IF E THEN H (CF,λ)。

又谈了模糊证据的表示。

最后是模糊推理模型。在模糊匹配过程中，对其相似度的计算就转化成了对其相应模糊集的计算了。模糊概念的相似度又称为匹配度，通常用语义距离好贴近度两种方式表示，语义距离越小，贴近度越大表明两个概念越相似。冲突消解的方法有：按匹配度大小排序法、按加权平均值法、按广义顺序关系排序。模糊推理有三种基本推理模式：模糊假言推理、拒取式推理、模糊假言三段论。当知识中只含有简单条件且不带可信度因子时，称为简单模糊推理。模糊关系的构造方法有：扎德方法、麦姆德尼法、米祖莫托法。最后又举了几个例子。

1 0