95%置信区间的正确理解

  统计/机器学习 假设检验 贝叶斯 开放问题    浏览次数: 1463
1

大家好,我想讨论一下如何正确理解置信区间

以前我理解的是,比如$[a, b]$是一个统计量$s$的95%置信区间,那么真实的$s$应该是有0.95的概率落在区间$[a,b]$内的。

上午和一个同学讨论,他说这个理解是错的,至于正确的理解,他自己也说不清,只是指出我的理解是错误的。

请问该如何正确理解置信区间的概念呢?

谢谢!


 

Arsjun   2018-02-26 15:19



   3个回答 
10

正确的说法应该是有95%的概率这个置信区间包含了正确的参数值。因为在传统统计学派中,待估参数是一个确定的值而不是随机变量。因此不能说有95%的概率落在某个置信区间。

对于贝叶斯学派,这种说法是完全ok的。

SofaSofa数据科学社区 DS面经 问答 实战

s3040608090   2018-02-26 20:38

精辟! - DuckU   2018-04-20 14:27
古典和贝叶斯吵了那么多年,而在我这种不严谨派别来看,这两种说法都oj8k,而且一个意思 - 陈十一   2018-05-18 14:54
7

s3040608090   说得很好。我再稍微补充一点

在贝叶斯学派中,待观测参数$p$落在一个给定的区间$[a, b]$的概率为0.95,那么$[a, b]$就是这个参数$p$的0.95置信区间。按照贝叶斯学派,题主的说法是正确的。贝叶斯学派下的置信区间有时候不是叫做confidence interval,而是称作credible interval,以示区别。


在频率学派中,参数$p$是固定的,而区间$[a, b]$是变量。区间$[a, b]$是根据样本得到的,而非根据总体。总体中不同的样本,根据某种方法会得到不同的区间$[a, b]$。所有的这样的区间会组成一个总体,从总体中抽随机抽样,有95%的概率抽到一个区间,使得$p$在这个区间内。


SofaSofa数据科学社区 DS面经 问答 实战

飞翔钉子   2018-03-01 15:06

6

频率学派的confidence interval和贝叶斯学派的credible interval是完全不同的概念(飞翔钉子说的那样)。只是在特定条件下这两个interval重合。比如求均值,且均值的先验概率是均匀分布时(相当于对均值没有约束,uninformative),这两个interval相同。但是遇到复杂情况,比如这个blog的example2,求出的confidence interval有错,而credible interval能得出正确结论。

根据blog的结论,应该停止使用频率学派的confidence interval。即使在不考虑prior情况下求均值时,confidence interval能给出合理的结果,其实是在计算贝叶斯学派的credible interval。

SofaSofa数据科学社区 DS面经 问答 实战

Zealing   2018-04-25 17:32

说到底就是两个派系之争。所以对置信区间有不同理解。 - Josh_Josh   2018-05-18 13:18
谢谢分享,感觉贝叶斯越来越受到重视了 - huanx8t   2018-06-25 05:57


  相关主题

置信网络和贝叶斯网络是一回事吗?   1回答

如何用python计算均值的置信区间?   1回答

中位数的置信区间有什么办法求解?   3回答

sns barplot调整置信水平   1回答

怎么计算(估计)ROC AUC的置信区间?   2回答

朴素贝叶斯中的朴素是什么意思?   1回答

朴素贝叶斯可以用来做回归吗?   2回答

贝叶斯网络和朴素贝叶斯有什么区别?   1回答

朴素贝叶斯分类器 naive_bayes.MultinomialNB() 为啥和手算的结果不一致   1回答

如何用python实现贝叶斯网络优化lightgbm超参数?   2回答

用sklearn朴素贝叶斯返回预测概率   2回答

sklearn朴素贝叶斯分类里GaussianNB和BernoulliNB的区别?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!