自助法(bootstrap)的0.632是怎么来的?

  统计/机器学习 抽样方法    浏览次数: 816
3

自助法(bootstrap)就是从样本中有放回的抽样。如果样本集中有n个样本,要自助法选出n个样本,那么一个样本被选出的概率是0.632。请问这个是怎么来的?有证明吗?谢谢!

 

FTD   2017-05-10 11:05



   1个回答 
6

有$n$个样本,我们有放回的随机从中抽取$n$次。

在第一次抽取时,样本A被选中的概率是$\frac{1}{n}$,不被选中的概率自然就是$1-\frac{1}{n}$。每次抽取都是独立的,所以当抽完$n$次之后,A一次都没有被抽中的概率就是

$$(1-\frac{1}{n})^n.$$

这个式子眼熟吗?这个就是高等数学中那个著名的极限

$$\lim_{n\rightarrow\infty}(1-\frac{1}n)^n=\frac{1}{e}.$$

所以当bootstrap样本总数很大的时候,任意一个样本被抽中的概率就是$1-\frac{1}{e}\approx1-\frac{1}{2.71828}\approx0.632$。


MrMath   2017-05-14 09:13



  相关问题

Jackknife vs Bootstrap   1回答

python对给定的集合进行有放回抽样?   2回答

蓄水池抽样算法的问题   1回答

滚雪球抽样算法的实现   0回答

bootstrap 一般用在哪些方面   1回答

什么是SMOTE sampling方法?   2回答

如何对流数据(stream data)进行无差别抽样   1回答

马尔可夫蒙特卡洛方法(MCMC)到底是什么呀?   1回答

两个变量不相关但是也不独立   1回答

为什么所有问答题目看不到   1回答

请问python已知某个元素,怎么得到该元素在dataframe中的位置   1回答

用python生成一个取值在a到b之间的随机矩阵   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!