随机投影的实际效果如何?

  统计/机器学习 无监督学习 数据降维 开放问题    浏览次数:653        分享
0

作为一个降维手段,随机投影的实际效果如何?和PCA比的话,有优势吗?

 

jialong   2018-11-13 13:06



   1个回答 
2

PCA是要找到一个最佳的投影矩阵(最大方差的方向),而且随机投影就是用一个随机的投影矩阵。既然要“找到”最好的,PCA的计算复杂度远远大于随机投影。

简单来说,随机投影是牺牲了一些精度,但是大大降低了计算量。所以你看你的“实际效果”指的是精读还是计算效率了。


如果数据的分布是接近高斯混合模型的时候,随机投影的效果也不错。(参考文献 Dasgupta, Sanjoy. "Experiments with random projection."

SofaSofa数据科学社区 DS面经 问答 实战

LiShanfei   2018-12-12 09:43



  相关主题

高维数据应该用什么聚类模型?   3回答

维数大于样本数的问题   3回答

python里怎么实现t-SNE降维?   1回答

hashing trick或者feature hashing是什么   1回答

分类变量,进行One hot编码,维度升高,如何处理?   4回答

一维的数据可以做聚类吗?   3回答

有没有对聚类成员个数有限制的聚类算法?   3回答

t-SNE如何实现降维?   1回答

线性回归或者逻辑回归中常提到的AIC和BIC是什么意思?   1回答

层次聚类里的linkage是什么意思?   2回答

聚类问题可以用stacking model的方法吗?   2回答

软聚类,硬聚类?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!