对两个相关系数做显著性的假设检验?

  统计/机器学习 假设检验 描述性统计    浏览次数:1940        分享
1

我有三组数据Y,A还有B。假设它们都是1000个数据点。Y和A的相关系数是0.78,Y和B的相关系数是0.75。有没有什么假设检验的方法,来判断A是更显著的?

类似于,H0是Correlation(Y,A) > Correlation(Y,B)。

最好是能够得到p值。


谢谢!

 

TheOne   2017-05-20 22:09



   1个回答 
4

可以考虑做bootstrap。

对$Y$有放回的抽样,抽出1000个,记为$Y_b$;对$A$有放回的抽样,抽出1000个,记为$A_b$;对B有放回的抽样,抽出1000个,记为$B_b$。

然后计算$Cor(Y_b,A_b)$和$Cor(Y_b,B_b)$。

重复$N$次。得到$N$个$Cor(Y_b,A_b)$和$N$个$Cor(Y_b,B_b)$。下面就是常规的单侧T检验了,可以得到你要的p value。


Ps. 题主有个概念弄错了,你这个情形下做假设检验,原假设应该是$Cor(Y,A) = Cor(Y,B)$,对立假设是$Cor(Y,A) > Cor(Y,B)$。


SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2017-05-24 10:32



  相关主题

相关中的效率指啥??   1回答

相关系数的p值是怎么算的?   2回答

特征相关性高的影响   2回答

如果x是等级变量, y是连续变量 相关分析是不是用speaman   1回答

一个连续变量和一个二元变量的相关系数怎么求?   2回答

为什么说皮尔逊相关系数是刻画了线性相关性?   2回答

相关系数很小的变量一定要删掉吗?   3回答

为啥计算pearson相关系数和线性回归的coef不同呢   2回答

Python计算两个数组的相关系数   3回答

如何对两个名义分类变量的关联性进行可视化展示?   2回答

有序分类变量的相关系数   2回答

超几何分布几何分布的关联?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!