multi-agent 控制类论文阅读

来源：互联网发布：尚品宅配怎么样知乎编辑：程序博客网时间：2024/05/21 19:11

多个体协调控制问题综述,2012

综述

　多个体协调控制的基本问题包括一致性控制、会合控制、聚结控制和编队控制。

　多个体系统区别于单体系统最本质的要素在于其通过网络进行信息传递与共享, 网络的不确定性对多个体协调控制性能的影响不容忽视, 因此, 该问题成为近几年协调控制领域研究的前沿和热点。

　多个体协调控制领域的研究对象也逐渐由前期简单的一阶或高阶线性系统过渡为更一般的非线性系统, 并考虑更为实际的系统不确定性等因素，典型系统为Euler-Lagrange 系统。

　一致性控制是指多个体通过信息的共享与交互, 实现某种状态的趋同。

　会合指系统中的所有个体速度逐渐趋于零, 且静止于某一位置。另一种定义要求MAS 中所有个体同时达到相同位置。

　编队控制的目标在于通过调整个体的行为使系统实现特定几何构型的整体性位移。

　按照时延属性可将系统中存在的时延分为两种: 通信时延和自时延。

　网络拓扑切换是指多个体的通信拓扑因某种原因从一种模式转换为其他模式。

　区别于同步网络, 异步网络中多体系统个体所对应的时间参考基准(时钟) 是不同的。
　.Euler-Lagrange 方程能够刻画大量实际的机械系统。

　2. 问题

　非线性系统的一致性控制研究

　非线性多个体含自时延的研究，目前该问题仍是多个体协调控制研究的热点和难点。

　通信拓扑同时存在时延和切换的情形。自时延和通信时延并存。

　异步网络

　针对含不确定性多个体协调控制的研究尚不多见, 且绝大多数文献采用了自适应控制技术。（自适应神经网络控制器是一种方法）

　因此网络化Euler-Lagrange 系统协调控制的研究成为近年来一个新的热点。

　当前最重要的问题是通过大量模型简化得到的模式化成果多, 而真正与实际结合的较少。

　“近邻规则” 的猜想与假设, 而Ballerini 等则发现鸟群中存在以拓扑距离进行通信的机制, 从而对“近邻规则” 提出了质疑.那么, 这些分布式的原则是否在自然界中是最有效率的?

基于BP神经网络的自适应控制,1994

训练BP神经网络的控制器方法主要有general learning 和 special learning，前者离线学习，后者把被控对象当做BP网络的输出层。
这篇文章是三层网络结构

planning,learning and coordination in multiagent decision processes

介绍了multi-agent、multi-agent plane、问题（独立的计划学习，协同决策）以及通常的解决方法（基于通信、协同策略、迭代学习）
单个智能体的决策过程，基于马尔科夫过程和强化学习，还有一些相关的问题
多个智能体的马尔科夫决策过程和协同问题，介绍了一些设计的学习协同的规则，也涉及多智能体的强化学习

0 0