如何对流数据(stream data)进行无差别抽样

  统计/机器学习 抽样方法 无监督学习 数据预处理
1

比如我有一个在线的列表,但是这个在不断的增加新的数据,我应该如何设计抽样方法才能使每个元素被抽到的概率一样呢

 

sjtufrc   2017-09-08 03:21



   1个回答 
3

这个问题应该就是大名鼎鼎的蓄水池问题。对应的解决方法就是蓄水池算法。

这里已经有人问过了。蓄水池抽样算法的问题


KingBug   2017-09-08 03:35



相关问题

什么是SMOTE sampling方法?   0回答

自助法(bootstrap)的0.632是怎么来的?   1回答

Jackknife vs Bootstrap   1回答

滚雪球抽样算法的实现   0回答

bootstrap 一般用在哪些方面   1回答

蓄水池抽样算法的问题   1回答

马尔可夫蒙特卡洛方法(MCMC)到底是什么呀?   1回答

进行K-Means聚类前,需要对数据做怎样的预处理?   1回答

层次聚类里的linkage是什么意思?   1回答

什么是K-Modes(K众数)聚类法?   1回答

层次聚类中的Ward's method是什么意思   0回答

软聚类,硬聚类?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!