怎么对pyspark dataframe更改列名

  统计/机器学习 Python    浏览次数: 657
0

怎么对pyspark dataframe更改列名?


我不是问的pandas dataframe,是pyspark.sql.dataframe.DataFrame。

(pandas更改列名的方法在这里。)

 

thatdeep   2018-06-16 05:19



   1个回答 
0

假如你要把df中一个叫old_col的列改成new_col,可以用以下的代码,其他列则不改变

import pyspark.sql.functions as F
new_df = (df
          .select(*[F.col(s).alias(new_col) if s == old_col else s for s in df.columns]))


kidd23   2018-06-21 08:37



  相关主题

返回pyspark dataframe的行数?   1回答

如何对pyspark dataframe删除一列   2回答

得到一个pyspark.sql.dataframe中所有列的名称   2回答

pyspark里unpersist()什么作用?   1回答

怎么将两个pyspark dataframe以串联的形式合并?   1回答

怎么把pyspark RDD dataframe转为pandas.DataFrame?   1回答

获取DataFrame所占空间的大小   2回答

python里的continue是什么意思   2回答

python里有没有类似excel里的那种数据透视表?   1回答

Jupiter notebook里一个cell显示多个dataframe   1回答

map lambda if逗号报错,invalid syntax   1回答

在jupyter notebook后台进程没关闭的情况下,只要是之前使用过且没有shutdown的notebook一直会占用内存吗?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!