点击率的95%置信区间该怎么算?

  统计/机器学习 AB Test 描述性统计    浏览次数:589        分享
1

点击率的准确性应该和样本大小有关系,比如A页面100个曝光,有20个点击,点击率是20%,B页面10000个曝光,有2000个点击,点击率也是20%。但是我觉得页面B的点击率是更靠谱的。

那怎么引入置信区间的概念呢?点击率的95%置信区间应该怎么算呢?

 

一亩三分   2022-04-08 19:35



   1个回答 
4

均值的95%置信区间的公式是

$$\left(\hat{p}-1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}},\hat{p}+1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right)$$

$\hat{p}$是点击率估计值,也就是点击次数除以展示次数;$n$是展示次数;1.96是95%在正态分布中对应的z-score;1.96后面的根号项是均值的标准差。


还有一种是叫做威尔逊校正,是对上面置信区间在小样本场景下的优化

$$\left(\frac{\hat{p}+\frac{1.96^2}{2n}}{1+\frac{1.96^2}{n}}-\frac{1.96}{1+\frac{1.96^2}{n}}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}+\frac{1.96^2}{4n^2}},\frac{\hat{p}+\frac{1.96^2}{2n}}{1+\frac{1.96^2}{n}}+\frac{1.96}{1+\frac{1.96^2}{n}}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}+\frac{1.96^2}{4n^2}}\right)$$


另外比较无脑的做法,是可以通过bootstrap直接估算置信区间,这个做法就不需要任何公式了。

SofaSofa数据科学社区DS面试题库 DS面经

yxyu   2022-04-16 08:09



  相关讨论

怎么对两个置信区间求和?

中位数的置信区间有什么办法求解?

怎么求1到5打分评级数据的置信区间?

如何用python计算均值的置信区间?

sns barplot调整置信水平

95%置信区间是不是每一次观测都不同呢

置信网络和贝叶斯网络是一回事吗?

怎么计算(估计)ROC AUC的置信区间?

AB测试样本量的问题

AB实验的哈希分桶技术是什么意思?

  随便看看

凸函数、凸集分别是什么意思?

如何复制一个pandas DataFrame

Pandas怎样对dataframe中的一个时间列进行排序?

统计里的IQR是什么意思?

sklearn r2_score返回负数