bootstrap 一般用在哪些方面

  统计/机器学习 抽样方法    浏览次数: 748
0

我了解的boostrap应该是一种抽样方法,那它主要应用在哪些方面,和Cross-validation又有什么区别呢?

 

sjtufrc   2017-09-07 22:12



   1个回答 
3

bootstrap和cross-validation本质上是完全两回事。


bootstrap说白了就是有放回的抽样。它的目的是降低estimate的variance。

1. 比如我们可以用bootstrap的方法数值上计算假设检验的p值。

2. 比如我们可以用bootstrap的方法来估计一个总体的某个统计量(比如均值、中位数)

3. 比如建模的时候用bootstrap的方法来选训练样本,得到多个训练模型。对多个模型组合,这个就是Bagging,Bootstrap aggregating。


cross-validation是进行模型验证的。cross-validation中的fold是随机选的,但是绝对不是bootstrap,因为fold抽样不是有放回的。


SofaSofa数据科学社区 DS面经 问答 实战

木子周   2017-09-07 23:47



  相关主题

滚雪球抽样算法的实现   0回答

parametric bootstrap和nonparametric bootstrap的区别是什么?   1回答

两阶段抽样和分层抽样是一回事吗?   1回答

蓄水池抽样算法的问题   1回答

自助法(bootstrap)的0.632是怎么来的?   1回答

Jackknife vs Bootstrap   1回答

python产生一个随机置换?   1回答

python对给定的集合进行有放回抽样?   2回答

SMOTE对于categorical feature如何处理?   2回答

什么是SMOTE sampling方法?   3回答

如何对流数据(stream data)进行无差别抽样   1回答

关于两个正态总体抽样分布的独立性问题   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!