对两个相关系数做显著性的假设检验?

  统计/机器学习 假设检验 描述性统计    浏览次数:8258        分享
1

我有三组数据Y,A还有B。假设它们都是1000个数据点。Y和A的相关系数是0.78,Y和B的相关系数是0.75。有没有什么假设检验的方法,来判断A是更显著的?

类似于,H0是Correlation(Y,A) > Correlation(Y,B)。

最好是能够得到p值。


谢谢!

 

TheOne   2017-05-20 22:09



   1个回答 
4

可以考虑做bootstrap。

对$Y$有放回的抽样,抽出1000个,记为$Y_b$;对$A$有放回的抽样,抽出1000个,记为$A_b$;对B有放回的抽样,抽出1000个,记为$B_b$。

然后计算$Cor(Y_b,A_b)$和$Cor(Y_b,B_b)$。

重复$N$次。得到$N$个$Cor(Y_b,A_b)$和$N$个$Cor(Y_b,B_b)$。下面就是常规的单侧T检验了,可以得到你要的p value。


Ps. 题主有个概念弄错了,你这个情形下做假设检验,原假设应该是$Cor(Y,A) = Cor(Y,B)$,对立假设是$Cor(Y,A) > Cor(Y,B)$。


SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2017-05-24 10:32



  相关讨论

怎么对两个样本的方差进行假设检验

假设检验的效力是什么?

假设检验中的p值是什么意思?为什么越小越好?

T检验需要提前假设吗?

单因素方差分析(one-way anova)在使用时需要有什么前提假设条件吗?

相关系数的p值是怎么算的?

怎么利用假设检验判断两个骰子是相同的?

线性回归因变量y不满足正态性假设

如果x是等级变量, y是连续变量 相关分析是不是用speaman

相关系数中的效率指啥?

  随便看看

请问在sklearn怎么在已有的模型的基础上训练新的数据?

什么是SMOTE sampling方法?

AIC可以是负数吗?

决策树、随机森林中的多重共线性问题

行数很多的pandas DataFrame如何在jupyter中完整显示?