如何对pyspark dataframe删除一列

  统计/机器学习 Python    浏览次数:11858        分享
0

怎么删除pyspark dataframe中的某一列?

 

thatdeep   2018-07-18 12:57



   3个回答 
5


df = df.drop('col')


SofaSofa数据科学社区DS面试题库 DS面经

kidd23   2018-07-19 11:25

3

也可以一次性删除多个列

cols_to_drop = ['c1', 'c2', 'c3', 'c4']
df = df.drop(*cols_to_drop)
SofaSofa数据科学社区DS面试题库 DS面经

abuu   2019-04-05 11:22

1


drop_list = ['col1', 'col2', ...]
df = df.select([col for col in df.columns if col not in drop_list])


SofaSofa数据科学社区DS面试题库 DS面经

dsjobhunter   2018-07-19 04:21



  相关讨论

得到一个pyspark.sql.dataframe中所有列的名称

pyspark中怎么对dataframe里的行按照列去重?

pyspark里如何进行SELECT DISTINCT操作?

怎么对pyspark dataframe更改列名

返回pyspark dataframe的行数?

怎么在pyspark里把dataframe写入csv文件?

怎么将两个pyspark dataframe以串联的形式合并?

怎么对pyspark.sql.dataframe按照某一列降序排列?

如何获取pyspark DataFrame的行数和列数?

pyspark dataframe的collect()方法是什么意思?

  随便看看

牛顿法到底是一阶优化算法还是二阶优化算法?

随机森林如何调参?

怎么添加pandas的dataframe到已有的csv文件,并且不覆盖原内容

训练集中有的特征含有缺失值,一般怎么处理

numpy里矩阵乘法matmul,@和dot的区别?