Isomap等距映射算法(1)

来源:互联网 发布:剑倚天下坐骑进阶数据 编辑:程序博客网 时间:2024/06/06 06:33

在学习ISOMAP之前先了解一下流形,从最简单的情况来说,直线或曲线是一维流形,而平面或者球面是二维流形,可以以此类推到多维流行,不过高维的东西对我们来说很难想象。

在论文中经常会看到“嵌入在高维空间中的低维流形”这种说法,怎么来理解呢,比如一块布,可以把它看成一个二维平面,这是一个二维的欧式空间(在我的理解中,欧式空间就是我们初中高中所学习的平面几何,立体几何中的空间),我们使它扭曲变形,它就变成了一个流形。这个流形直观上看是二维空间在三维空间中被扭曲的结果。

需要注意的是,流形并不是一个“形状”,而是一个“空间”。其实流形并不需要依靠嵌入在一个“外围空间”而存在,稍微正式一点来说,一个 d 维的流形就是一个在任意点出局部同胚于(简单地说,就是正逆映射都是光滑的一一映射)欧氏空间 (重点就是明白流形是一个空间)

接着来谈Isomap,它是一种降维算法,一种非迭代的全局优化算法。

降维的目的是找出隐藏在高维数据中的低维结构,可以降低计算的复杂性。Isomap是一种非线性的降维算法。

从Isomap的名字上看,它是一种等距映射算法,也就是说降维后的点,两两之间距离不变,这个距离是测地距离。

解释一下测地距离,例如在地球上,要从南极到北极,欧式距离就是两点之间直线最短,测地距离则是曲线的长度,更符合实际情况。

对于测地距离的计算,离得很近的点可以用欧氏距离来代替,离的较远的点,使用图论中的最短路径来逼近。(具体怎么做还没弄懂)

附上该算法的链接

最后来几张图

欧氏距离示意图

欧氏距离

测地距离示意图

测地距离

降维后示意图

降维

2 0
原创粉丝点击