Largevis算法

来源:互联网 发布:部落冲突雷电法术数据 编辑:程序博客网 时间:2024/05/21 08:53

Largevis是国内某博士在TSNE基础上加工得到的一种新型算法,其改进处在于用一种半并行的树搜索算法+低维空间中基于核距离的概率分布,并采用了大量的百万级以上数据作为例子,画出了非常炫酷的散点图,我只能说他的计算机太厉害了,SNE系列的算法一直都有一个最大的毛病,就是计算成本大,消耗内存,每次迭代都需要所有样本参与进行。


在计算高维分布之前,邻域图的重建采用以下算法,就是多个点同时进行遍历更新,总体上没什么特别出彩的地方:


计算高位空间中的条件概率分布传承了TSNE的做法:


计算低维空间中的条件概率分布,用了距离+核函数作为其概率,当然,最后都需要加上一个总体的重心:


损失函数依然是两个分布的KL散度,不过,作者没有介绍出这种方法的下降梯度,理论上来说,最原始的SNE的梯度和TSNE的梯度都能近似这里的下降梯度,但是更精准的梯度能帮助更快达到最优,尤其是接近最优点时(当然啦,这里有没有最优点还未可知)


作者给出了很炫酷的图,这里分享一下,拜谢TangJian博士。

数据集介绍:








2 0
原创粉丝点击