自助法(bootstrap)的0.632是怎么来的?

  统计/机器学习 抽样方法    浏览次数: 1774
3

自助法(bootstrap)就是从样本中有放回的抽样。如果样本集中有n个样本,要自助法选出n个样本,那么一个样本被选出的概率是0.632。请问这个是怎么来的?有证明吗?谢谢!

 

FTD   2017-05-10 11:05



   1个回答 
10

有$n$个样本,我们有放回的随机从中抽取$n$次。

在第一次抽取时,样本A被选中的概率是$\frac{1}{n}$,不被选中的概率自然就是$1-\frac{1}{n}$。每次抽取都是独立的,所以当抽完$n$次之后,A一次都没有被抽中的概率就是

$$(1-\frac{1}{n})^n.$$

这个式子眼熟吗?这个就是高等数学中那个著名的极限

$$\lim_{n\rightarrow\infty}(1-\frac{1}n)^n=\frac{1}{e}.$$

所以当bootstrap样本总数很大的时候,任意一个样本被抽中的概率就是$1-\frac{1}{e}\approx1-\frac{1}{2.71828}\approx0.632$。


MrMath   2017-05-14 09:13

两年前面试还被问到过,可惜当时一脸懵X了 - Nagozi   2018-04-02 07:57


  相关主题

蓄水池抽样算法的问题   1回答

parametric bootstrap和nonparametric bootstrap的区别是什么?   0回答

bootstrap 一般用在哪些方面   1回答

Jackknife vs Bootstrap   1回答

滚雪球抽样算法的实现   0回答

python对给定的集合进行有放回抽样?   2回答

python产生一个随机置换?   1回答

什么是SMOTE sampling方法?   3回答

SMOTE对于categorical feature如何处理?   2回答

关于两个正态总体抽样分布的独立性问题   1回答

如何生成两个相关的标准正态随机变量   2回答

如何对流数据(stream data)进行无差别抽样   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!