无人驾驶车与环境的关系

来源：互联网发布：网络电影里的女主角编辑：程序博客网时间：2024/04/30 00:43

本文以无人驾驶为例，简单的阐述《人工智能，一种现代方法》中对于Intelligent Agent的讲解。

一、无人驾驶汽车的组成

无人驾驶车，即一个智能agent，跟通用的agent定义一样，由三部分组成，感知，执行，环境。感知获取环境信息，通过执行指令反作用于环境。无人驾驶系统主要由感知，规划控制，地图，定位等组成。

感知：探测行人，车辆，红绿灯，车道线，交通标志等信息；
地图：一个比较火的概念是高精度地图，包含车道数，车道线位置，直行或转向车道，道路限速，道路间的拓扑结构等定制信息；
定位：通过差分，激光或者视觉Slam进行cm级定位；
规划控制：定位当前位置，通过地图进行路径规划，生成油门、制动、转向控制量避开障碍物稳定快速的达到目标点。

二、无人驾驶评价
无人驾驶系统是否合理，可以从以下四个方面衡量：
1 衡量表现是否优秀的标准；
2 系统对于环境的先验知识；
3 无人驾驶系统能执行的动作；
4 无人驾驶系统感知到的环境序列；

简单地，如果一个无人驾驶系统，通过感知环境序列，在已有的先验知识的基础上，从可执行的动作中，决策出了表现优秀的行为，那么这个无人驾驶系统是合理的。
这个地方要注意合理和完美的区别，合理是满足约束的局部最优，完美是全局最优。全局最优在现实中几乎是不可能存在的。但是一个无人驾驶系统，仅仅通过先验知识进行决策是不够的，先验只是人们总结的部分case，不能够全面的描述变化的环境。系统在与环境的交互过程，习得经验，总结并从经验中学习，这是系统的自主性，对于一个智能驾驶系统相当的重要。

三、环境的描述
一个合理的系统首先是深入的了解需要解决的问题。需要解决的问题来自于任务环境，第一步得分析任务环境。
可从以下四个方面分析任务环境，无人驾驶为例：

1 性能表现：无人驾驶车的安全性，舒适型，经济型等；
2 外部环境：车，路，人，交通流等；
3 执行器：转向，加减速，转向灯，喇叭灯；
4 传感器：毫米波，激光雷达，摄像头，超声波灯；

可以从以下几个属性对环境进行描述：

1 可观测性：如果每时每刻，传感器都能获取全部的环境信息，特别是跟决策相关的所有信息，那么该环境是全部可观测的。否则，因为噪声和传感器的不准确（漏检，误检）丢失了部分环境信息，那么该环境是部分可观测的。无人驾驶环境是部分可观测的，这就需要做一些跟踪来维持对环境的认识。

2 单agent还是多agnet
环境中是否存在多个agent，多agent间的关系包括合作和竞争。

3 确定的还是随机的
如果可以通过当前的环境和执行的控制量来推断环境的下一个状态，那么该环境是确定环境，否则，环境是随机的。如果环境是部分可观测和随机的，那么该环境是不确定的。不确定的环境通过引入概率进行描述。

4 片段的还是连续的
上一次的感知序列对下一次的感知序列没有影响，相互独立的，那么环境是片段式的，否则是连续的。在无人驾驶中，做决策时，考虑多久的信息片段。

5 静态的还是动态的
这个很好理解，环境是否随时间变化。自动驾驶环境无时不刻不在变化。

6 连续的还是离散的
无人驾驶环境多少连续的，通过数字处理后离散化了。

7 已知的还是未知的
在已知的环境中，行动对应着结果，种瓜得瓜。

四、无人驾驶车的类型

无人驾驶车由硬件和软件组成。硬件包括车本身，传感器，执行器等，软件主要是算法程序。根据算法程序对感知的信息的反应方式，可以分成以下几类：

1 简单的应激行动
不考虑历史感知信息，只根据当前感知到的信息采取行动，跟人的很多条件反射类似，比如眨眼，膝跳反射等。特点是非常简单，但是智能有限。在无人驾驶程序中，可见到明显不够智能的例子很多：感知误检到一帧障碍物，车辆则会执行刹车动作。在感知信息不够准确，或者说是环境只部分可观测时，表现出来的性能不是让人特别满意。

2 基于模型的行动
通过对环境的跟踪可以缓解环境的部分可观测性带来的影响。怎么来做外部环境的跟踪呢，首先得知道他的变化规律，即给外部环境建立一个模型。自动驾驶车不仅要知道外部环境是怎么变化的，也要知道自己在控制量的作用下是如何运动的，比如车辆模型。基于外在和内在两个模型更好的做出合理的决策。

3 基于目标的行动
知道了内外部运行模型还不够，无人驾驶系统需要知道自己的目标是什么，比如，目的地在哪？只有知道了目标才不会南辕北辙。有了目的地，在路口的左右转才会有选择的依据。在无人驾驶系统中的路径规划。

4 基于效用的行动
很多导航软件可以根据距离最短，用时最少，红绿灯最少等指标选择路径。同样的，知道了目的地，也知道了外部环境的变化，无人驾驶车可以选择快速的达到目的地，也可以选择舒适平稳的达到目的地。设定一个效用标准可以帮助无人驾驶车做更合理的决策。

5 基于学习的行动
有老师教肯定好，在没有老师教的情况下，比如从学校毕业进入社会了，能教你的人寥寥无几，这个时候自学能力就特别重要。对于机器也是这样，能设定的先验知识和模型都是有限的，如何能从经验中自我学习才是检验一个系统是否真正智能的标准。一个能自我学习的系统可以由四个部分组成：评判器，学习器，问题产生器，行动选择器。学习器从评判器处获得反馈来调整行动选择器的决策。问题产生器的作用是建议行动选择器选择一些不一样的行动。这种行动是一种尝试，有点变异进化的味道。

阅读全文

0 0