相关系数的p值是怎么算的?

  统计/机器学习 假设检验 描述性统计    浏览次数:14167        分享
0

比如说网上的这个例子,计算a和b的相关系数

最后得到相关系数0.99,p value是0.068。这个p值是怎么计算的?

>> import scipy.stats as stats
>> a = [1.2, 1.5, 1.9]; b = [2.2, 2.5, 3.1]
>> stats.pearsonr(a,b)
(0.99419162560192009, 0.068648785502029797)


 

dsjobhunter   2018-07-30 00:45



   2个回答 
3

这个p value对应的null hypothesis是数组a和b的相关系数为0。

p value服从$n-2$的t分布,$n$是数组a的样本个数,$r$是a和b的相关系数,p value对应的t-score的计算公式

$$t=r\sqrt{\frac{n-2}{1-r^2}}$$

然后查t分布的表就可以得到p value了。

有兴趣的话可以阅读http://janda.org/c10/Lectures/topic06/L24-significanceR.htm

SofaSofa数据科学社区DS面试题库 DS面经

LiShanfei   2018-11-26 13:20

1

类似问题对两个相关系数做显著性的假设检验?


SofaSofa数据科学社区DS面试题库 DS面经

Jiho   2018-08-01 13:01



  相关讨论

相关系数中的效率指啥?

有序分类变量的相关系数

如果x是等级变量, y是连续变量 相关分析是不是用speaman

一个连续变量和一个二元变量的相关系数怎么求?

Python计算两个数组的相关系数

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?

为啥计算pearson相关系数和线性回归的coef不同呢

两个变量不相关但是也不独立

如何对两个名义分类变量的关联性进行可视化展示?

为什么说皮尔逊相关系数是刻画了线性相关性?

  随便看看

R里线性回归结果中最后的F-statistic什么意思?有什么用?

sklearn里的LabelEncoder什么用?

seaborn.distplot直方图的y轴的数值是什么意思?

dropout rate一般设置多大?

分类特征的目标编码是什么意思?