95%置信区间的正确理解

  统计/机器学习 假设检验 贝叶斯 开放问题    浏览次数:10121        分享
3

大家好,我想讨论一下如何正确理解置信区间

以前我理解的是,比如$[a, b]$是一个统计量$s$的95%置信区间,那么真实的$s$应该是有0.95的概率落在区间$[a,b]$内的。

上午和一个同学讨论,他说这个理解是错的,至于正确的理解,他自己也说不清,只是指出我的理解是错误的。

请问该如何正确理解置信区间的概念呢?

谢谢!


 

Arsjun   2018-02-26 15:19



   3个回答 
15

正确的说法应该是有95%的概率这个置信区间包含了正确的参数值。因为在传统统计学派中,待估参数是一个确定的值而不是随机变量。因此不能说有95%的概率落在某个置信区间。

对于贝叶斯学派,这种说法是完全ok的。

SofaSofa数据科学社区DS面试题库 DS面经

s3040608090   2018-02-26 20:38

精辟! - DuckU   2018-04-20 14:27
古典和贝叶斯吵了那么多年,而在我这种不严谨派别来看,这两种说法都oj8k,而且一个意思 - 陈十一   2018-05-18 14:54
“而在我这种不严谨派别来看,这两种说法都oj8k,而且一个意思” +1 - sioom   2022-03-21 23:12
13

s3040608090   说得很好。我再稍微补充一点

在贝叶斯学派中,待观测参数$p$落在一个给定的区间$[a, b]$的概率为0.95,那么$[a, b]$就是这个参数$p$的0.95置信区间。按照贝叶斯学派,题主的说法是正确的。贝叶斯学派下的置信区间有时候不是叫做confidence interval,而是称作credible interval,以示区别。


在频率学派中,参数$p$是固定的,而区间$[a, b]$是变量。区间$[a, b]$是根据样本得到的,而非根据总体。总体中不同的样本,根据某种方法会得到不同的区间$[a, b]$。所有的这样的区间会组成一个总体,从总体中抽随机抽样,有95%的概率抽到一个区间,使得$p$在这个区间内。


SofaSofa数据科学社区DS面试题库 DS面经

飞翔钉子   2018-03-01 15:06

非常清晰,顶! - ctcolin   2019-05-13 14:39
8

频率学派的confidence interval和贝叶斯学派的credible interval是完全不同的概念(飞翔钉子说的那样)。只是在特定条件下这两个interval重合。比如求均值,且均值的先验概率是均匀分布时(相当于对均值没有约束,uninformative),这两个interval相同。但是遇到复杂情况,比如这个blog的example2,求出的confidence interval有错,而credible interval能得出正确结论。

根据blog的结论,应该停止使用频率学派的confidence interval。即使在不考虑prior情况下求均值时,confidence interval能给出合理的结果,其实是在计算贝叶斯学派的credible interval。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-04-25 17:32

说到底就是两个派系之争。所以对置信区间有不同理解。 - Josh_Josh   2018-05-18 13:18
谢谢分享,感觉贝叶斯越来越受到重视了 - huanx8t   2018-06-25 05:57


  相关讨论

置信网络和贝叶斯网络是一回事吗?

95%置信区间是不是每一次观测都不同呢

如何用python计算均值的置信区间?

中位数的置信区间有什么办法求解?

怎么求1到5打分评级数据的置信区间?

怎么对两个置信区间求和?

sns barplot调整置信水平

点击率的95%置信区间该怎么算?

怎么计算(估计)ROC AUC的置信区间?

用贝叶斯怎么输出模型的预测准确率?

  随便看看

opencv里waitkey和destroyAllWindows有什么用?

推荐开放数据库

二元分类问题中经常提到的TP,TN,FN,FP都是什么意思?

单一变量下的异常检测该怎么做?

dropout rate一般设置多大?