t-SNE如何实现降维?

  统计/机器学习 数据降维 特征选择    浏览次数: 672
2

t-SNE是如何实现降维的?

 

MrMath   2017-04-13 10:08



   1个回答 
5

一直没有人回答,我试着简短的强行回答一下。


t-SNE中t是指T distribution,s是指stochastic,n是指neighbor,e是指embedding。


简单来说,t-SNE做的是一种从高维空间到低维空间的保“距”变换。


如果两个点在100维的空间里“距离”是1,我们希望找到一个映射,把这两个点映射到低维(比如2维)空间里,它们的距离也是1。这样达到的效果就是,在原空间里距离远的点,那么在新的低维空间里距离也远;在原空间里距离近的点,那么在新的低维空间里距离也近。


这个所谓的“距离”,不是真正的距离,而是一种相似度。两个数据点的相似度的计算主要是依据两点的欧式距离,并且对其进行一些标准化的处理。处理时用到了t分布这个假设。


这个从高维到低维的映射,首先需要设置随机初始点,然后进行优化,从而使得两个“距离”相等。


岛歌   2018-02-11 14:01



  相关主题

线性回归或者逻辑回归中常提到的AIC和BIC是什么意思?   1回答

python里怎么实现t-SNE降维?   1回答

hashing trick或者feature hashing是什么   1回答

分类变量,进行One hot编码,维度升高,如何处理?   3回答

维数大于样本数的问题   3回答

训练集加入噪声防止over fitting还是加剧overfitting?   3回答

关于朴素贝叶斯特征工程、特征选择的问题   2回答

对于组合特征怎么理解?   1回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

利用PCA降维,降到几维比较合适?   1回答

除了PCA,还有什么降维的方法?   9回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!