为什么说皮尔逊相关系数是刻画了线性相关性?

  统计/机器学习 概率分布 回归分析 描述性统计    浏览次数: 120
0

为什么说皮尔逊相关系数是刻画了线性相关性?如果两个变量相关,但是不一定是线性关系,那么用皮尔逊相关系数会怎么样?

 

烙神经   2018-10-25 11:43



   2个回答 
3

如果有两个变量$X$和$Y$,并且它们的尺度都是-1到1的,那么$X$和$Y$的皮尔逊相关系数就是$X$和$Y$做一元线性回归的回归系数解释),从这点我们可以看明显的看出,皮尔逊相关系数就是描述的线性关系。

另外一个反例是,如果$Y=X^2$,并且$X$的范围是-1到1,尽管它们是有关联的,但是它们的皮尔逊系数为0,因为它们并没有任何线性关系。

SofaSofa数据科学社区 DS面经 问答 实战

zl_pku   2018-11-12 15:57

2

"If a relationship between two variables is not linear, the rate of increase or decrease can change as one variable changes, causing a "curved pattern" in the data. This curved trend might be better modeled by a nonlinear function, such as a quadratic or cubic function, or be transformed to make it linear. Plot 4 shows a strong relationship between two variables. However, because the relationship is not linear, the Pearson correlation coefficient is only +0.244."


source: https://support.minitab.com/en-us/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/linear-nonlinear-and-monotonic-relationships/

SofaSofa数据科学社区 DS面经 问答 实战

Ethan16   2018-11-12 11:29



  相关主题

两个变量不相关但是也不独立   2回答

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?   3回答

一个连续变量和一个二元变量的相关系数怎么求?   2回答

有序分类变量的相关系数   2回答

Python计算两个数组的相关系数   3回答

如何对两个名义分类变量的关联性进行可视化展示?   1回答

相关系数的p值是怎么算的?   1回答

对两个相关系数做显著性的假设检验?   1回答

序列的autocorrelation(自相关系数)的计算公式   1回答

相关系数很小的变量一定要删掉吗?   0回答

如何生成两个相关的标准正态随机变量   2回答

关于Python中 theano的相关问题   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!