连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,
就是效率没有pearson相关系数高。
如上边这句话
1个回答
算spearman相关系数,先计算两组数$X,Y$排序,得到$rank_X,rank_Y$,然后再计算pearson相关系数。
排序的计算复杂度是$\mathcal{O}(n\log{}n)$,算pearson相关系数的计算复杂度是$\mathcal{O}(n)$。所以spearman相关系数的计算复杂度主要受排序的影响,效率低点。
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
如果x是等级变量, y是连续变量 相关分析是不是用speaman
1回答
为啥计算pearson相关系数和线性回归的coef不同呢
2回答
回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?
3回答
两个变量不相关但是也不独立
2回答
有序分类变量的相关系数
2回答
相关系数很小的变量一定要删掉吗?
3回答
序列的autocorrelation(自相关系数)的计算公式
1回答
特征相关性高的影响
2回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!