t-SNE如何实现降维？-SofaSofa

t-SNE是如何实现降维的？

MrMath 2017-04-13 10:08

一直没有人回答，我试着简短的强行回答一下。

t-SNE中t是指T distribution，s是指stochastic，n是指neighbor，e是指embedding。

简单来说，t-SNE做的是一种从高维空间到低维空间的保“距”变换。

如果两个点在100维的空间里“距离”是1，我们希望找到一个映射，把这两个点映射到低维（比如2维）空间里，它们的距离也是1。这样达到的效果就是，在原空间里距离远的点，那么在新的低维空间里距离也远；在原空间里距离近的点，那么在新的低维空间里距离也近。

这个所谓的“距离”，不是真正的距离，而是一种相似度。两个数据点的相似度的计算主要是依据两点的欧式距离，并且对其进行一些标准化的处理。处理时用到了t分布这个假设。

这个从高维到低维的映射，首先需要设置随机初始点，然后进行优化，从而使得两个“距离”相等。

岛歌 2018-02-11 14:01

t-SNE如何实现降维？