95%置信区间的正确理解-SofaSofa

大家好，我想讨论一下如何正确理解置信区间。

以前我理解的是，比如$[a, b]$是一个统计量$s$的95%置信区间，那么真实的$s$应该是有0.95的概率落在区间$[a,b]$内的。

上午和一个同学讨论，他说这个理解是错的，至于正确的理解，他自己也说不清，只是指出我的理解是错误的。

请问该如何正确理解置信区间的概念呢？

谢谢！

Arsjun 2018-02-26 15:19

3个回答

正确的说法应该是有95%的概率这个置信区间包含了正确的参数值。因为在传统统计学派中，待估参数是一个确定的值而不是随机变量。因此不能说有95%的概率落在某个置信区间。

对于贝叶斯学派，这种说法是完全ok的。

SofaSofa数据科学社区 DS面试题库 DS面经

s3040608090 2018-02-26 20:38

精辟！ - DuckU 2018-04-20 14:27

古典和贝叶斯吵了那么多年，而在我这种不严谨派别来看，这两种说法都oj8k，而且一个意思 - 陈十一 2018-05-18 14:54

“而在我这种不严谨派别来看，这两种说法都oj8k，而且一个意思” +1 - sioom 2022-03-21 23:12

s3040608090 说得很好。我再稍微补充一点

在贝叶斯学派中，待观测参数$p$落在一个给定的区间$[a, b]$的概率为0.95，那么$[a, b]$就是这个参数$p$的0.95置信区间。按照贝叶斯学派，题主的说法是正确的。贝叶斯学派下的置信区间有时候不是叫做confidence interval，而是称作credible interval，以示区别。

在频率学派中，参数$p$是固定的，而区间$[a, b]$是变量。区间$[a, b]$是根据样本得到的，而非根据总体。总体中不同的样本，根据某种方法会得到不同的区间$[a, b]$。所有的这样的区间会组成一个总体，从总体中抽随机抽样，有95%的概率抽到一个区间，使得$p$在这个区间内。

SofaSofa数据科学社区 DS面试题库 DS面经

飞翔钉子 2018-03-01 15:06

非常清晰，顶！ - ctcolin 2019-05-13 14:39

频率学派的confidence interval和贝叶斯学派的credible interval是完全不同的概念（飞翔钉子说的那样）。只是在特定条件下这两个interval重合。比如求均值，且均值的先验概率是均匀分布时（相当于对均值没有约束，uninformative），这两个interval相同。但是遇到复杂情况，比如这个blog的example2，求出的confidence interval有错，而credible interval能得出正确结论。

根据blog的结论，应该停止使用频率学派的confidence interval。即使在不考虑prior情况下求均值时，confidence interval能给出合理的结果，其实是在计算贝叶斯学派的credible interval。

SofaSofa数据科学社区 DS面试题库 DS面经

Zealing 2018-04-25 17:32

说到底就是两个派系之争。所以对置信区间有不同理解。 - Josh_Josh 2018-05-18 13:18

谢谢分享，感觉贝叶斯越来越受到重视了 - huanx8t 2018-06-25 05:57

95%置信区间的正确理解

Warning

3个回答

Warning

Warning

Warning