【人工智能】第四章 超越经典搜索

来源:互联网 发布:手机自动打开数据咋办 编辑:程序博客网 时间:2024/06/01 09:47

4.1 局部搜索算法和最优化问题
1)局部搜索算法:
a)从单个当前结点(而不是多条路径)出发,通常只移动到它的邻近状态,一般情况下不保存搜索路径;
b)优点:它们只用很少的内存(通常为常数);它们经常能在系统算法不是用的很大或无限的(连续的)状态空间中找到合理的解;
2)爬山法:
a)概念:简单的循环过程,不断向值增加的方向持续移动(登高),到达一个“峰顶”(局部极大值)时终止;
b)变形:随机爬山法(随机选择上山移动的下一步,收敛慢一点但在某些状态空间的地形图能找到更好的解);首选爬山法(随机生成后继结点知道生成一个优于当前结点的后继,在后继结点很多的时候适用);随机重启爬山法(如果一开始没成功就重新开始搜索,通过随机生成初始状态引导爬山法搜索,直到找到目标)。
这里写图片描述
3)模拟退火算法:
a)概念:把爬山法和随机行走以某种方式结合,同时得到效率和完备性的想法是合理的;
这里写图片描述
4)局部束搜索:
a)概念:从k个随机生成的状态开始,每一步全部k个状态的所有后继状态全部被生成,如果其中有一个是目标状态,则算法停止,否则,它从整个后续列表中选择k个最佳的后继,重复这个过程;
b)变形:随机束搜索(不是从候选后继集合中选择最好的k个后继状态,而是随机选择k个后继状态);
5)遗传算法:
a)概念:种群;个体;适应度函数;杂交;变异;
这里写图片描述

4.3 使用不确定动作的搜索
与或搜索树:或结点(在确定性环境中,分支由Agent在每个状态下的选择形成);与结点(在不确定环境中,分支由环境选择每个行动的后果形成);

4.4 使用部分可观察信息的搜索
信念状态:整个信念状态空间包含物理状态的每个可能集合。
1) 无观察信息的搜索
2) 部分观察信息的搜索:一个信念状态到另一个信念状态的特定行动分为三个阶段:预测阶段、观察预测阶段、更新阶段;