怎么删除pyspark dataframe中的某一列?
3个回答
也可以一次性删除多个列
cols_to_drop = ['c1', 'c2', 'c3', 'c4']
df = df.drop(*cols_to_drop)
SofaSofa数据科学社区DS面试题库 DS面经drop_list = ['col1', 'col2', ...]
df = df.select([col for col in df.columns if col not in drop_list])
相关主题
pyspark里如何进行SELECT DISTINCT操作?
1回答
如何获取pyspark DataFrame的行数和列数?
1回答
pyspark dataframe的collect()方法是什么意思?
2回答
怎么在pyspark里把dataframe写入csv文件?
2回答
sparkml里的word2vec是基于哪种模型的?
1回答
怎么将两个pyspark dataframe以串联的形式合并?
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!