随机投影的实际效果如何?

  统计/机器学习 无监督学习 数据降维 开放问题    浏览次数:6653        分享
0

作为一个降维手段,随机投影的实际效果如何?和PCA比的话,有优势吗?

 

jialong   2018-11-13 13:06



   1个回答 
2

PCA是要找到一个最佳的投影矩阵(最大方差的方向),而且随机投影就是用一个随机的投影矩阵。既然要“找到”最好的,PCA的计算复杂度远远大于随机投影。

简单来说,随机投影是牺牲了一些精度,但是大大降低了计算量。所以你看你的“实际效果”指的是精读还是计算效率了。


如果数据的分布是接近高斯混合模型的时候,随机投影的效果也不错。(参考文献 Dasgupta, Sanjoy. "Experiments with random projection."

SofaSofa数据科学社区DS面试题库 DS面经

LiShanfei   2018-12-12 09:43



  相关讨论

高维数据应该用什么聚类模型?

什么时候应该用isomap降维方法?

三维以上聚类都要先降维?10维数据直接聚类然后silhouette判断效果可以吗?

低维嵌入(low dimension embedding)是什么意思?

维数大于样本数的问题

怎么评价tSNE的降维效果?

为什么LDA降维最多降到类别数k-1?

python里怎么实现t-SNE降维?

有没有对聚类成员个数有限制的聚类算法?

HDBSCAN和DBSCAN这两种聚类方法有什么区别?

  随便看看

求多个torch tensor的平均值

点击率的95%置信区间该怎么算?

非方阵的逆是什么

为什么梯度的反方向是函数下降最快的方向?

numpy.array从行向量转为列向量