相关系数的p值是怎么算的?

  统计/机器学习 假设检验 描述性统计    浏览次数:1273        分享
0

比如说网上的这个例子,计算a和b的相关系数

最后得到相关系数0.99,p value是0.068。这个p值是怎么计算的?

>> import scipy.stats as stats
>> a = [1.2, 1.5, 1.9]; b = [2.2, 2.5, 3.1]
>> stats.pearsonr(a,b)
(0.99419162560192009, 0.068648785502029797)


 

dsjobhunter   2018-07-30 00:45



   2个回答 
3

这个p value对应的null hypothesis是数组a和b的相关系数为0。

p value服从$n-2$的t分布,$n$是数组a的样本个数,$r$是a和b的相关系数,p value对应的t-score的计算公式

$$t=r\sqrt{\frac{n-2}{1-r^2}}$$

然后查t分布的表就可以得到p value了。

有兴趣的话可以阅读http://janda.org/c10/Lectures/topic06/L24-significanceR.htm

SofaSofa数据科学社区DS面试题库 DS面经

LiShanfei   2018-11-26 13:20

1

类似问题对两个相关系数做显著性的假设检验?


SofaSofa数据科学社区DS面试题库 DS面经

Jiho   2018-08-01 13:01



  相关主题

一个连续变量和一个二元变量的相关系数怎么求?   2回答

如果x是等级变量, y是连续变量 相关分析是不是用speaman   1回答

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?   3回答

有序分类变量的相关系数   2回答

相关中的效率指啥??   1回答

Python计算两个数组的相关系数   3回答

序列的autocorrelation(自相关系数)的计算公式   1回答

对两个相关系数做显著性的假设检验?   1回答

特征相关性高的影响   2回答

两个变量不相关但是也不独立   2回答

python如何产生指定相关系数的多组数据   1回答

怎么判断是因果还是相关?   0回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!