怎么对dataframe中的某一列groupby求缺失值的个数?

  统计/机器学习 数据预处理 Python    浏览次数:6170        分享
0

假设一个pandas dataframe,有两列,一列a,一列b,我想按照a列group by,数b列中的缺失值的个数,请问该如何完成代码?

 

xiaojr   2018-12-06 13:35



   1个回答 
3

pandas里没有累计缺失值个数的函数,所以要用lambda

df.groupby('a').agg({'b': lambda x: x.isnull().sum()})
SofaSofa数据科学社区DS面试题库 DS面经

zl_pku   2018-12-10 23:45



  相关讨论

dataframe每行或者每列中缺失值(na, nan, null)的个数

如何判断缺失值是否是随机的缺失?

数据预处理中,都有哪些方法能够处理缺失值(missing value)

训练集中有的特征含有缺失值,一般怎么处理

如何处理聚类中的missing data

pandas DataFrame中去掉缺失值多于50%的列

怎样处理具有大标签的数据?以及标签数据缺失怎么处理?

pandas里有没有类似于sql里coalesce的函数来处理缺失值?

如何在日期序列中补齐缺失的日期

怎么利用python对时间序列中缺失值进行线性插值?

  随便看看

不用洛必达法则证明sin x比上x的极限是1

查看sklearn的线性回归系数的p value

怎么提取pandas dataframe中某一列每个字符串的前n个字符?

多重检验中的FDR(false discovery rate, 错误发现率)是什么?

支持向量机(SVM)里的支持向量是什么意思