bootstrap 一般用在哪些方面

  统计/机器学习 抽样方法    浏览次数:5733        分享
0

我了解的boostrap应该是一种抽样方法,那它主要应用在哪些方面,和Cross-validation又有什么区别呢?

 

sjtufrc   2017-09-07 22:12



   1个回答 
3

bootstrap和cross-validation本质上是完全两回事。


bootstrap说白了就是有放回的抽样。它的目的是降低estimate的variance。

1. 比如我们可以用bootstrap的方法数值上计算假设检验的p值。

2. 比如我们可以用bootstrap的方法来估计一个总体的某个统计量(比如均值、中位数)

3. 比如建模的时候用bootstrap的方法来选训练样本,得到多个训练模型。对多个模型组合,这个就是Bagging,Bootstrap aggregating。


cross-validation是进行模型验证的。cross-validation中的fold是随机选的,但是绝对不是bootstrap,因为fold抽样不是有放回的。


SofaSofa数据科学社区DS面试题库 DS面经

木子周   2017-09-07 23:47



  相关讨论

Jackknife vs Bootstrap

蓄水池抽样算法的问题

两阶段抽样和分层抽样是一回事吗?

parametric bootstrap和nonparametric bootstrap的区别是什么?

自助法(bootstrap)的0.632是怎么来的?

滚雪球抽样算法的实现

python对给定的集合进行有放回抽样?

python产生一个随机置换?

把训练集分成n份,用同种算法在每个子训练集上训练再把预测平均,效果如何?

SMOTE对于categorical feature如何处理?

  随便看看

logloss的取值范围是多少?一般好的分类器能达到多少?

为什么LR要用Sigmoid函数?

机器学习基础

推荐系统中的召回(recall)是什么意思?

plt.scatter plot怎么让不同的类别有不同的颜色