lie group and computer vision : 李群、李代数在计算机视觉中的应用

来源:互联网 发布:工业设计知乎 编辑:程序博客网 时间:2024/04/28 02:58

在多视角几何中,特别是在一些恢复相机运动轨迹的模型中,我们需要将相机的旋转和平移表示出来。通常情况下,我们都是在欧几里得空间中用R和t来进行相应的运算得到相机轨迹。然而,在很多论文中,作者们却喜欢用Lie algebrase(3)、so(3) 以及 Lie group SE(3)、SO(3) 之类的表示。紧接着,出现了很多术语,比如twist, tangent space,也出现了一些运算,比如exp(),log()之类的,看得我是云里雾里。

   比如下面这个公式, 是由三个角速度组成的向量,表示对应的旋转矩阵, 表示由三个角速度组成的反对称矩阵(skew-symmetric matrix)。 

自然要问为啥通过指数运算能够把角速度映射到旋转矩阵,它的背后又有什么样的物理意义,这中间是否有一些尽量直观的解释。

   本篇博客将从最基础的内容出发,用直观的容易理解的方式对旋转矩阵和李代数之间的关系进行推导,如有错误,请指出,希望共同进步。

预备知识:

   在进入正题之前,我们先需要复习下向量叉积(cross product),以及反对称矩阵(skew symmetric matrix),在计算机视觉中最初遇到这些概念应该是在求解本征矩阵时,然而,他们在沟通刚体变换矩阵和李代数之间扮演着十分重要的作用。 
  对给定的两个三维实数向量,它们的叉积可以通过下面的公式计算出来: 

叉积
叉积有如下性质: 
叉积性质
这说明通过叉积运算得到的结果实际上是一个垂直于u,v 平面的向量。 
  这种两个向量的运算可以通过一个矩阵来表示,即  其中 是一个3*3的实数矩阵: 
反对称矩阵
注意向量u上带一个帽子表示的是由它构成的反对称矩阵。同时由这个矩阵也很容易看出有 请记住这个性质。并且任意一个3*3的反对称矩阵,我们能够找到一个三维向量和它对应。 
  至于什么是刚体变换,什么是旋转矩阵,旋转矩阵有哪些性质这些更基础的知识在这里不再一一补充。 

下面的内容中,都是基于3维空间,所以没有特别说明时,所说的旋转矩阵都是3*3的,平移向量也是3维的。并且所有向量上带一个帽子的表示的是它的反对称矩阵形式。

旋转矩阵与 so(3)

  我们知道对于旋转矩阵,旋转矩阵本身乘以它的转置等于单位矩阵:

旋转矩阵性质
对上式求导可以得到: 
旋转矩阵求导  (1)
这个1式推得的结果不正好满足反对称矩阵的性质吗?因此肯定存在一个三维向量,使得该向量组成的反对称矩阵满足:
这里写图片描述 (2)
对2式中两边各右乘一个旋转R(t),得到: 
这里写图片描述 (3)
这个等式是不是很熟悉?一个变量的导数等于它本身再乘以一个系数。Bingo,是他是他就是他,我们高斯微积分中熟悉的指数! 
  在介绍我们期待已久的指数映射前,先挖掘挖掘(3)式的一些含义。如果初始时刻,那么有那么在单位矩阵附近的一个旋转矩阵,我们能用一阶导来近似得到: 
这里写图片描述
这是不是有点类似于速度位移之类的。我们把所有的这些反对称矩阵集合起来就组成了一个所谓的李代数Lie algebraso(3) : 
这里写图片描述
而把所有的旋转矩阵集合起来呢,就有了一个所谓的李群Lie group SO(3) 注意是大写: 
这里写图片描述
上式中的约束表示R是旋转矩阵。由前面的推导公式三知道如果R是单位矩阵,那它的导数就是一个反对称矩阵,所以只有反对称矩阵组成的空间,即 so(3),我们称之为在在单位矩阵处的正切空间tangent space.为什么称为正切呢?回忆二维曲线在某处的导数是一条切线。对于这个三维球面,那么它的导数应该是个切面。如下图所示,图片来源于tangent space 的 wiki: 
这里写图片描述
可是对于那些不是单位矩阵的旋转矩阵R该怎么找在他们位置处的正切空间呢?由公式3我们知道,在反对称矩阵的右边乘以R就能够得到R的导数,所以在非单位矩阵的R处的正切空间就是反对称矩阵乘以R就行了。

指数映射:

  回到公式(3),把旋转矩阵R用x替换掉,如下:

这里写图片描述
求微分方程得到:
这里写图片描述
其中是矩阵的指数映射:
这里写图片描述) (4)
好了,此时我们假设R(0)=I,即单位矩阵,就可以得到: 
这里写图片描述 (5)
当然可以验证验证这个指数是不是旋转矩阵: 
这里写图片描述
所以,我们能够说指数映射将so(3)映射到了SO(3)
这里写图片描述
也就是说找了一个通道,它将切平面上的一点可以映射到球面体上去。但是,指数还带一个矩阵这不好算吧,没关系,马上带来Rodrigues formula for rotation matrix。首先反对称矩阵有如下性质: 
这里写图片描述
此时指数映射的泰勒展开式(4)式能够整理成如下形式:
这里写图片描述
注意公式中两个括号里面的内容,他们就是sin(t)和(1-cost(t)),其实这种形式的推导在欧拉方程那里也见到过。最后得到:
这里写图片描述
  当然,对于任意的旋转矩阵,我们也能够找到一组对应的w,t: 
这里写图片描述

刚体变换和SE(3)

  前面还只说了旋转,实际上刚体变换还有平移。所以,和只有旋转矩阵构成的李群SO(3) 一样,我们也可以有由刚体变换得到的李群SE(3) :

这里写图片描述
和之前的推导一样,我们可以对如下的刚体变换矩阵求导:
这里写图片描述
对这个矩阵的每部分进行分析可知,存在一个反对称矩阵和三维向量使得下面两式成立: 
这里写图片描述
这里写图片描述
即可以得到:
这里写图片描述
所以,我们可以和反对称矩阵一样,定一个矩阵,注意这里这个帽子不代表反对称矩阵了: 
这里写图片描述
接着我们就能得到: 
这里写图片描述
这和之前的推导太像了。由于有了前面的铺垫,我们可以直接给出g(t)附近的近似,而不必像之前那样从R(t)=I开始: 
这里写图片描述
可以称之为在曲线g(t)处的”正切向量”,而在机器人领域,我们称它为twist。这个twist呢,就像我们开葡萄酒塞时螺旋的角速度和前进的线速度。于是把这些twist集合起来就有了刚体变换的李代数se(3):
这里写图片描述
当然这个twist矩阵也可以表示成一个六维的向量
这里写图片描述
同理,由
这里写图片描述
可以得到:
这里写图片描述
如果假设g(0)=I,有
这里写图片描述
又到了指数映射,这个矩阵的指数映射可以写成如下形式:
这里写图片描述
于是我们知道了如何将se(3) 映射到SE(3)。 

  到这里基本理清了SE,SO之类的与刚体变换之间的关系,看视觉SLAM类的论文以及相应代码中有关lie部分应该没啥压力了。这篇博文可以说是我看慕尼黑工大(TUM)多视角几何教学视频的笔记,YouTube链接点击这里,这位牛的飞老师的英语吐字清晰,大家应该能够听懂。当然,老师也是参看的别人的文档,这里我也把讲lie 和计算机视觉的两个文档传到了csdn上,供大家下载

转自:白巧克力亦唯心 http://blog.csdn.net/heyijia0327

http://blog.csdn.net/heyijia0327

0 0
原创粉丝点击