如何对流数据(stream data)进行无差别抽样

  统计/机器学习 抽样方法 无监督学习 数据预处理    浏览次数: 429
1

比如我有一个在线的列表,但是这个在不断的增加新的数据,我应该如何设计抽样方法才能使每个元素被抽到的概率一样呢

 

sjtufrc   2017-09-08 03:21



   1个回答 
3

这个问题应该就是大名鼎鼎的蓄水池问题。对应的解决方法就是蓄水池算法。

这里已经有人问过了。蓄水池抽样算法的问题


KingBug   2017-09-08 03:35



  相关主题

什么是SMOTE sampling方法?   2回答

SMOTE对于categorical feature如何处理?   2回答

蓄水池抽样算法的问题   1回答

滚雪球抽样算法的实现   0回答

parametric bootstrap和nonparametric bootstrap的区别是什么?   0回答

自助法(bootstrap)的0.632是怎么来的?   1回答

Jackknife vs Bootstrap   1回答

bootstrap 一般用在哪些方面   1回答

python对给定的集合进行有放回抽样?   2回答

python产生一个随机置换?   1回答

关于两个正态总体抽样分布的独立性问题   1回答

如何生成两个相关的标准正态随机变量   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!