t-SNE如何实现降维?

  统计/机器学习 数据降维 特征选择    浏览次数:5325        分享
2

t-SNE是如何实现降维的?

 

MrMath   2017-04-13 10:08



   1个回答 
5

一直没有人回答,我试着简短的强行回答一下。


t-SNE中t是指T distribution,s是指stochastic,n是指neighbor,e是指embedding。


简单来说,t-SNE做的是一种从高维空间到低维空间的保“距”变换。


如果两个点在100维的空间里“距离”是1,我们希望找到一个映射,把这两个点映射到低维(比如2维)空间里,它们的距离也是1。这样达到的效果就是,在原空间里距离远的点,那么在新的低维空间里距离也远;在原空间里距离近的点,那么在新的低维空间里距离也近。


这个所谓的“距离”,不是真正的距离,而是一种相似度。两个数据点的相似度的计算主要是依据两点的欧式距离,并且对其进行一些标准化的处理。处理时用到了t分布这个假设。


这个从高维到低维的映射,首先需要设置随机初始点,然后进行优化,从而使得两个“距离”相等。


SofaSofa数据科学社区DS面试题库 DS面经

岛歌   2018-02-11 14:01



  相关讨论

LDA线性判别分析进行信号分类时如何对训练数据和测试数据降维?

线性回归或者逻辑回归中常提到的AIC和BIC是什么意思?

怎么利用卡方分布来进行特征选择?

为什么LDA降维最多降到类别数k-1?

急,求兄弟帮手调试 随机森林的 R 程序

python里怎么实现t-SNE降维?

递归特征消除(RFE)方法可以用到生存分析数据上吗?

关于朴素贝叶斯特征工程、特征选择的问题

询问LASSO特征选择与频次图绘制

hashing trick或者feature hashing是什么

  随便看看

pandas同时返回一个dataframe的前几行(head)和后几行(tail)

pandas把一列日期转换为星期

deep learning中的pooling是什么意思?

如果样本不是正态分布,还能用t-test或者z-test吗?

随机梯度下降(sgd)的收敛问题