如何对pyspark dataframe删除一列

  统计/机器学习 Python    浏览次数:2028        分享
0

怎么删除pyspark dataframe中的某一列?

 

thatdeep   2018-07-18 12:57



   3个回答 
5


df = df.drop('col')


SofaSofa数据科学社区DS面试题库 DS面经

kidd23   2018-07-19 11:25

2

也可以一次性删除多个列

cols_to_drop = ['c1', 'c2', 'c3', 'c4']
df = df.drop(*cols_to_drop)
SofaSofa数据科学社区DS面试题库 DS面经

abuu   2019-04-05 11:22

1


drop_list = ['col1', 'col2', ...]
df = df.select([col for col in df.columns if col not in drop_list])


SofaSofa数据科学社区DS面试题库 DS面经

dsjobhunter   2018-07-19 04:21



  相关主题

返回pyspark dataframe的行数?   1回答

怎么在pyspark里把dataframe写入csv文件?   1回答

怎么对pyspark dataframe更改列名   2回答

如何获取pyspark DataFrame的行数和列数?   1回答

SparkML里线性回归底层是什么原理?   0回答

怎么对pyspark.sql.dataframe按照某一列降序排列?   1回答

spark ml和spark mllib区别   5回答

pyspark dataframe的collect()方法是什么意思?   2回答

怎么将两个pyspark dataframe以串联的形式合并?   1回答

得到一个pyspark.sql.dataframe中所有列的名称   2回答

pyspark里unpersist()什么作用?   1回答

pyspark里如何进行SELECT DISTINCT操作?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!