相关中的效率指啥??

  统计/机器学习 描述性统计    浏览次数:441        分享
0

连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,

  就是效率没有pearson相关系数高。


如上边这句话

 

constant007   2019-01-02 14:10



   1个回答 
2

算spearman相关系数,先计算两组数$X,Y$排序,得到$rank_X,rank_Y$,然后再计算pearson相关系数。

排序的计算复杂度是$\mathcal{O}(n\log{}n)$,算pearson相关系数的计算复杂度是$\mathcal{O}(n)$。所以spearman相关系数的计算复杂度主要受排序的影响,效率低点。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2019-01-05 04:05



  相关主题

有序分类变量的相关系数   2回答

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?   3回答

如何对两个名义分类变量的关联性进行可视化展示?   2回答

一个连续变量和一个二元变量的相关系数怎么求?   2回答

Python计算两个数组的相关系数   3回答

特征相关性高的影响   2回答

如果x是等级变量, y是连续变量 相关分析是不是用speaman   1回答

对两个相关系数做显著性的假设检验?   1回答

为啥计算pearson相关系数和线性回归的coef不同呢   2回答

关于Python中 theano的相关问题   1回答

相关系数很小的变量一定要删掉吗?   3回答

两个变量不相关但是也不独立   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!