怎么对dataframe中的某一列groupby求缺失值的个数?

  统计/机器学习 数据预处理 Python    浏览次数:379        分享
0

假设一个pandas dataframe,有两列,一列a,一列b,我想按照a列group by,数b列中的缺失值的个数,请问该如何完成代码?

 

xiaojr   2018-12-06 13:35



   1个回答 
2

pandas里没有累计缺失值个数的函数,所以要用lambda

df.groupby('a').agg({'b': lambda x: x.isnull().sum()})
SofaSofa数据科学社区DS面试题库 DS面经

zl_pku   2018-12-10 23:45



  相关主题

训练集中有的特征含有缺失值,一般怎么处理   5回答

如何处理聚类中的missing data   3回答

dataframe每行或者每列中缺失值(na, nan, null)的个数   1回答

数据预处理中,都有哪些方法能够处理缺失值(missing value)   2回答

怎样处理具有大标签的数据?以及标签数据缺失怎么处理?   3回答

如何判断缺失值是否是随机的缺失?   2回答

怎么利用python对时间序列中缺失值进行线性插值?   1回答

python里把数据中某一列中的na,nan,缺失值都替换成0?   1回答

pandas DataFrame中去掉缺失值多于50%的列   1回答

pandas里有没有类似于sql里coalesce的函数来处理缺失值?   2回答

决策树或者随机森林能够直接处理missing data吗?   1回答

怎麼將dataframe 欄位 對應到原有的csv檔 而寫入   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!