95%置信区间的正确理解

  统计/机器学习 假设检验 开放问题    浏览次数: 544
1

大家好,我想讨论一下如何正确理解置信区间

以前我理解的是,比如$[a, b]$是一个统计量$s$的95%置信区间,那么真实的$s$应该是有0.95的概率落在区间$[a,b]$内的。

上午和一个同学讨论,他说这个理解是错的,至于正确的理解,他自己也说不清,只是指出我的理解是错误的。

请问该如何正确理解置信区间的概念呢?

谢谢!


 

Arsjun   2018-02-26 15:19



   3个回答 
10

正确的说法应该是有95%的概率这个置信区间包含了正确的参数值。因为在传统统计学派中,待估参数是一个确定的值而不是随机变量。因此不能说有95%的概率落在某个置信区间。

对于贝叶斯学派,这种说法是完全ok的。

s3040608090   2018-02-26 20:38

精辟! - DuckU   2018-04-20 14:27
古典和贝叶斯吵了那么多年,而在我这种不严谨派别来看,这两种说法都oj8k,而且一个意思 - 陈十一   2018-05-18 14:54
7

s3040608090   说得很好。我再稍微补充一点

在贝叶斯学派中,待观测参数$p$落在一个给定的区间$[a, b]$的概率为0.95,那么$[a, b]$就是这个参数$p$的0.95置信区间。按照贝叶斯学派,题主的说法是正确的。贝叶斯学派下的置信区间有时候不是叫做confidence interval,而是称作credible interval,以示区别。


在频率学派中,参数$p$是固定的,而区间$[a, b]$是变量。区间$[a, b]$是根据样本得到的,而非根据总体。总体中不同的样本,根据某种方法会得到不同的区间$[a, b]$。所有的这样的区间会组成一个总体,从总体中抽随机抽样,有95%的概率抽到一个区间,使得$p$在这个区间内。


飞翔钉子   2018-03-01 15:06

4

频率学派的confidence interval和贝叶斯学派的credible interval是完全不同的概念(飞翔钉子说的那样)。只是在特定条件下这两个interval重合。比如求均值,且均值的先验概率是均匀分布时(相当于对均值没有约束,uninformative),这两个interval相同。但是遇到复杂情况,比如这个blog的example2,求出的confidence interval有错,而credible interval能得出正确结论。

根据blog的结论,应该停止使用频率学派的confidence interval。即使在不考虑prior情况下求均值时,confidence interval能给出合理的结果,其实是在计算贝叶斯学派的credible interval。

Zealing   2018-04-25 17:32

说到底就是两个派系之争。所以对置信区间有不同理解。 - Josh_Josh   2018-05-18 13:18


  相关主题

多重比较校正   1回答

F检验的使用场景   3回答

t检验,需要测试集验证集吗?   3回答

多重检验中的FDR(false discovery rate, 错误发现率)是什么?   2回答

假设检验中的p值是什么意思?为什么越小越好?   2回答

单侧T检验p值与双侧T检验p值的关系   1回答

T检验的effect size是什么?有什么含义吗?   1回答

z test和t test什么区别?   1回答

如何从假设检验的角度去理解AB testing   2回答

配对T检验和两样本T检验是一回事么?   1回答

假设检验的效力是什么?   1回答

Python单侧T检验   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!