大家好,我想讨论一下如何正确理解置信区间。
以前我理解的是,比如$[a, b]$是一个统计量$s$的95%置信区间,那么真实的$s$应该是有0.95的概率落在区间$[a,b]$内的。
上午和一个同学讨论,他说这个理解是错的,至于正确的理解,他自己也说不清,只是指出我的理解是错误的。
请问该如何正确理解置信区间的概念呢?
谢谢!
3个回答
正确的说法应该是有95%的概率这个置信区间包含了正确的参数值。因为在传统统计学派中,待估参数是一个确定的值而不是随机变量。因此不能说有95%的概率落在某个置信区间。
对于贝叶斯学派,这种说法是完全ok的。
SofaSofa数据科学社区DS面试题库 DS面经s3040608090 说得很好。我再稍微补充一点
在贝叶斯学派中,待观测参数$p$落在一个给定的区间$[a, b]$的概率为0.95,那么$[a, b]$就是这个参数$p$的0.95置信区间。按照贝叶斯学派,题主的说法是正确的。贝叶斯学派下的置信区间有时候不是叫做confidence interval,而是称作credible interval,以示区别。
在频率学派中,参数$p$是固定的,而区间$[a, b]$是变量。区间$[a, b]$是根据样本得到的,而非根据总体。总体中不同的样本,根据某种方法会得到不同的区间$[a, b]$。所有的这样的区间会组成一个总体,从总体中抽随机抽样,有95%的概率抽到一个区间,使得$p$在这个区间内。
频率学派的confidence interval和贝叶斯学派的credible interval是完全不同的概念(飞翔钉子说的那样)。只是在特定条件下这两个interval重合。比如求均值,且均值的先验概率是均匀分布时(相当于对均值没有约束,uninformative),这两个interval相同。但是遇到复杂情况,比如这个blog的example2,求出的confidence interval有错,而credible interval能得出正确结论。
根据blog的结论,应该停止使用频率学派的confidence interval。即使在不考虑prior情况下求均值时,confidence interval能给出合理的结果,其实是在计算贝叶斯学派的credible interval。
SofaSofa数据科学社区DS面试题库 DS面经