机器学习中的群论方法

来源：互联网发布：数据的保密性编辑：程序博客网时间：2024/04/24 05:18

参考链接：http://m.blog.csdn.net/blog/iverson_49

群论最初应用于高次方程解析解可解性的研究，致力于寻找方程解集的规则化和抽象化，并提取可解性的一般规律。在机器学习方面，模式分类主要应用数学方法，剥离概率范畴，一些模式分离的方法与方程解析形式化的方法有几分相似，群论方法也应用于机器学习领域。

现如今，无论是计算机视觉和医学图像处理，都把视角从对欧式空间的研究转到了对模式分布流形(Manifold)的研究。因此对黎曼几何和李群的理解显得尤为重要。这里就从一些图像和视觉问题的实例来介绍黎曼几何和李群。

流形(Manifold)

流形，定义为具有局部欧式特性的拓扑空间，可以看做曲线(1D),曲面(2D)的高维扩展，即嵌入高维欧式空间的低维拓扑空间。

研究意义

机器学习的样本和真实世界的样本，因其内部的生存联系，大多数数据并不有序存在于欧式空间中，而是有序存在于某一个流形空间内。最简单的，用 v 表示一条数据 (先暂且把他看做一个 n 维向量，即一个高维空间中的点 )，可以是人脸部的形状特征，可以是一张CT图像的灰度，甚至可以是一段视频的内容。就比如 v表示一张照片中人脸的形状,每条数据记录了k个轮廓点的位置(v=x1,x2,...,xk). 为了去除不同照片大小带来的尺度差异，一般的做法是将数据归一化，即使得

$x_1^2+x_2^2+...+x_k^2=1$

我们发现这样一来，此类数据其实存在于k-1维的圆上。那么问题是，给定两个脸部形状数据v1和v2，怎么求平均的脸部形状呢？如果将其看成是欧式空间的数据，那么平均值为1/2(v1+v2)，但是这个结果根本就不在k-1维的圆上！

对于更复杂的问题，数据可能存在于圆以外的更复杂的流形之上，所以这就引出了对流形操作的概念。比如，数据求平均值不应该用一般的欧式平均，而应该采用流形上的Frechet Mean。欧式空间的线性回归( Linear Regression )对应了流形上的Geodesic Regresstion . 欧式空间中的 PCA 就变成了PGA (Principal Geodesic Analysis )。也有一些方法把数据转化到某个切平面中，在用一般的欧式空间方法分析。

另一方面，图像的形变与转化，比如平移，旋转，similarity transform，或者一般的微分同胚映射(Diffeomorphism)，这些转换即可以看成是群结构，也可以看成是流形。这就引出了李群 (Lie Groups：https://en.wikipedia.org/wiki/Lie_group ) 在图像处理中的应用。比如医学图像配准中，为了研究类似流体的平滑形变 (LDDMM) ，李群给出了一套很好的框架，使得对于平滑形变的求解和统计分析可以在单位形变的切平面上完成。

总而言之，对于黎曼几何和李群的了解有助于图像处理类工作的研究。

另外参考：通俗易解的机器学习方法入门

0 0