怎么计算(估计)ROC AUC的置信区间?

  统计/机器学习 监督式学习 模型验证 描述性统计    浏览次数:18399        分享
0

ROC AUC比较常用用来评价二元分类器的精度,那么怎么计算(估计)ROC AUC的置信区间?

 

得得得   2018-10-31 22:31



   4个回答 
6

可以看这两篇论文

Confidence Intervals for the Area under the ROC Curve(Cortes and Mohri)

Confidence Intervals for the Area Under an ROC Curve(PASS)

SofaSofa数据科学社区DS面试题库 DS面经

sasa   2018-12-16 00:44

3

roc的auc也是可以阐释为概率的(见这里)。所以就是相当于去估计一个硬币正面朝上的概率的置信区间。

用bootstrap的方法,选出$n$组正负样本,正样本的概率比负样本大的组数为$k$,那么roc auc的估计值为$k/n$,这个估计值的方差为

$$\frac{\text{auc}(1-\text{auc})}{n}=\frac{k/n(1-k/n)}{n}=\frac{kn-k^2}{n^3}$$

只要$n$够大,这个估计值应该是服从正态分布的,均值和方差都已知,也就能得到置信区间。

SofaSofa数据科学社区DS面试题库 DS面经

strong.man   2018-11-20 15:57

感觉不是太对,按照你的解释,你估计出的auc越大,它的置信区间必然越窄? - matt   2019-09-17 14:02
1

可以多跑几次validation,比如30次,然后求这30次auc的均值和方差,根据正态分布,得到置信区间。

SofaSofa数据科学社区DS面试题库 DS面经

orz_k   2018-11-08 11:48

1

周志华的机器学习前面部分就有。打开qq群流行的pdf看看,和朴素贝叶斯统计相关,和医院判断hiv阳性阴性概率的方法差不多,就是条件概率,打表就能算了~

SofaSofa数据科学社区DS面试题库 DS面经

栗悟饭与龟波功   2019-09-18 16:40



  相关讨论

怎么求1到5打分评级数据的置信区间?

如何用python计算均值的置信区间?

怎么对两个置信区间求和?

中位数的置信区间有什么办法求解?

sns barplot调整置信水平

95%置信区间是不是每一次观测都不同呢

为什么负样本的auc会和正样本的auc不一样呢?

roc auc小于0.5是什么情况?

为什么非平衡的数据更适合用精度-召回曲线,而不是roc auc?

如何利用python画分类器的ROC曲线?

  随便看看

plt.bar怎么设置每个bar的颜色?

条件概率证明P(a,b|c) > P(a,b)

怎么理解图像识别里的dice系数?

【站务】我们回来了

神经网络里为什么隐藏层越多越好?