怎么对pandas dataframe的行按照权重进行抽样?

  统计/机器学习 抽样方法 数据预处理 Python    浏览次数:6215        分享
0

怎么对pandas dataframe的行按照某个权重进行有放回地抽样?

假设每行都有一个权重,权重大的行就更容易抽到,甚至多次被抽到,这个怎么实现呢?

 

ShenShiyi   2019-02-08 10:28



   1个回答 
3

假设你要你抽出nrows行,df中有一列weight表示你说的那个权重,下面的代码就可以实现你需要的功能

newdf = df.sample(n=nrwos, replace=True, weights=df['weight'])
SofaSofa数据科学社区DS面试题库 DS面经

strong.man   2019-02-09 13:02



  相关讨论

怎么对pandas dataframe的行进行有放回抽样?

SMOTE对于categorical feature如何处理?

什么是SMOTE sampling方法?

python产生一个随机置换?

python对给定的集合进行有放回抽样?

自助法(bootstrap)的0.632是怎么来的?

两阶段抽样和分层抽样是一回事吗?

bootstrap 一般用在哪些方面

蓄水池抽样算法的问题

滚雪球抽样算法的实现

  随便看看

线性回归需要满足哪些基本前提假设

如何在numpy array尾部增加一行

单一变量下的异常检测该怎么做?

向量梯度下降优化的最佳步长?

怎么计算(估计)ROC AUC的置信区间?