怎么对pyspark dataframe更改列名

  统计/机器学习 Python    浏览次数: 187
0

怎么对pyspark dataframe更改列名?


我不是问的pandas dataframe,是pyspark.sql.dataframe.DataFrame。

(pandas更改列名的方法在这里。)

 

thatdeep   2018-06-16 05:19



   1个回答 
0

假如你要把df中一个叫old_col的列改成new_col,可以用以下的代码,其他列则不改变

import pyspark.sql.functions as F
new_df = (df
          .select(*[F.col(s).alias(new_col) if s == old_col else s for s in df.columns]))


kidd23   2018-06-21 08:37



  相关主题

python中计算加权平均   1回答

返回pyspark dataframe的行数?   1回答

获取DataFrame所占空间的大小   2回答

Jupyter中InteractiveShell.ast_node_interactivity = "all"有什么用?   1回答

map lambda if逗号报错,invalid syntax   1回答

请问python已知某个元素,怎么得到该元素在dataframe中的位置   1回答

python里清除已经定义过的变量   1回答

python里的<<或者>>符号是什么意思?   2回答

python里有没有类似matlab里linspace的功能?   2回答

python怎么读取txt格式的数据文件?   1回答

python如何读取元素中含有逗号的csv文件   1回答

python里的continue是什么意思   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!