相关中的效率指啥??

  统计/机器学习 描述性统计    浏览次数:204        分享
0

连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,

  就是效率没有pearson相关系数高。


如上边这句话

 

constant007   2019-01-02 14:10



   1个回答 
2

算spearman相关系数,先计算两组数$X,Y$排序,得到$rank_X,rank_Y$,然后再计算pearson相关系数。

排序的计算复杂度是$\mathcal{O}(n\log{}n)$,算pearson相关系数的计算复杂度是$\mathcal{O}(n)$。所以spearman相关系数的计算复杂度主要受排序的影响,效率低点。

SofaSofa数据科学社区 DS面经 问答 实战

Zealing   2019-01-05 04:05



  相关主题

如果x是等级变量, y是连续变量 相关分析是不是用speaman   1回答

为啥计算pearson相关系数和线性回归的coef不同呢   2回答

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?   3回答

有序分类变量的相关系数   2回答

如何对两个名义分类变量的关联性进行可视化展示?   2回答

Python计算两个数组的相关系数   3回答

一个连续变量和一个二元变量的相关系数怎么求?   2回答

两个变量不相关但是也不独立   2回答

超几何分布几何分布的关联?   2回答

相关系数的p值是怎么算的?   2回答

为什么说皮尔逊相关系数是刻画了线性相关性?   2回答

序列的autocorrelation(自相关系数)的计算公式   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!