dataframe每行或者每列中缺失值(na, nan, null)的个数

  统计/机器学习 数据预处理 Python    浏览次数:35674        分享
0

根据常用的缺失值的处理方法,我想先看看我的df里每行和每列缺失值的个数?这个在python或者pandas里有没有快捷地数个数的方法?

 

机器小白   2017-04-25 09:50



   2个回答 
8

返回每行缺失值的总数

df.isnull().sum(axis=1)

返回每列缺失值的总数

df.isnull().sum(axis=0)
SofaSofa数据科学社区DS面试题库 DS面经

WinJ   2019-05-12 12:50

这个方法比较简洁 - tbh   2019-05-12 15:19
2


>>> df.count()               #按照列来数非缺失值的个数
>>> df.count(axis=1)     #按照行来数非缺失值的个数


例子:

>>> df
       a           c          b
0      1          3          NaN
1      2          5          0
2      3         NaN      NaN
3      4         NaN      0

# 每列缺失值的个数

>>> df.shape[0] - df.count()
a    0
b    2
c    2


# 每行缺失值的个数

>>> df.shape[1] - df.count(axis=1)
0      1
1      0
2      2
3      1
SofaSofa数据科学社区DS面试题库 DS面经

派大星   2017-04-25 12:12



  相关讨论

数据预处理中,都有哪些方法能够处理缺失值(missing value)

怎么对dataframe中的某一列groupby求缺失值的个数?

如何判断缺失值是否是随机的缺失?

训练集中有的特征含有缺失值,一般怎么处理

怎样处理具有大标签的数据?以及标签数据缺失怎么处理?

pandas里有没有类似于sql里coalesce的函数来处理缺失值?

pandas DataFrame中去掉缺失值多于50%的列

如何处理聚类中的missing data

决策树或者随机森林能够直接处理missing data吗?

如何在日期序列中补齐缺失的日期

  随便看看

Data Application Lab怎么样?

sklearn SGDClassifier的partial_fit是什么意思?

如果样本不是正态分布,还能用t-test或者z-test吗?

python里的<<或者>>符号是什么意思?

随机森林如何调参?