自助法(bootstrap)的0.632是怎么来的?

  统计/机器学习 抽样方法    浏览次数: 1156
3

自助法(bootstrap)就是从样本中有放回的抽样。如果样本集中有n个样本,要自助法选出n个样本,那么一个样本被选出的概率是0.632。请问这个是怎么来的?有证明吗?谢谢!

 

FTD   2017-05-10 11:05



   1个回答 
7

有$n$个样本,我们有放回的随机从中抽取$n$次。

在第一次抽取时,样本A被选中的概率是$\frac{1}{n}$,不被选中的概率自然就是$1-\frac{1}{n}$。每次抽取都是独立的,所以当抽完$n$次之后,A一次都没有被抽中的概率就是

$$(1-\frac{1}{n})^n.$$

这个式子眼熟吗?这个就是高等数学中那个著名的极限

$$\lim_{n\rightarrow\infty}(1-\frac{1}n)^n=\frac{1}{e}.$$

所以当bootstrap样本总数很大的时候,任意一个样本被抽中的概率就是$1-\frac{1}{e}\approx1-\frac{1}{2.71828}\approx0.632$。


MrMath   2017-05-14 09:13

两年前面试还被问到过,可惜当时一脸懵X了 - Nagozi   2018-04-02 07:57


  相关主题

bootstrap 一般用在哪些方面   1回答

Jackknife vs Bootstrap   1回答

蓄水池抽样算法的问题   1回答

滚雪球抽样算法的实现   0回答

python对给定的集合进行有放回抽样?   2回答

什么是SMOTE sampling方法?   2回答

SMOTE对于categorical feature如何处理?   2回答

如何对流数据(stream data)进行无差别抽样   1回答

关于两个正态总体抽样分布的独立性问题   1回答

马尔可夫蒙特卡洛方法(MCMC)到底是什么呀?   1回答

SVM的支持向量最少有几个?   1回答

两个变量不相关但是也不独立   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!