怎么把pyspark RDD dataframe转为pandas.DataFrame?
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
thatdeep 2018-04-18 23:14
df = my_spark_df.toPandas()
strong.man 2018-04-20 10:54
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
怎么对pyspark.sql.dataframe按照某一列降序排列?
怎么对pyspark dataframe更改列名
pyspark里如何进行SELECT DISTINCT操作?
pyspark中怎么对dataframe里的行按照列去重?
pyspark dataframe的collect()方法是什么意思?
pyspark里unpersist()什么作用?
怎么在pyspark里把dataframe写入csv文件?
返回pyspark dataframe的行数?
怎么将两个pyspark dataframe以串联的形式合并?
得到一个pyspark.sql.dataframe中所有列的名称
随便看看
numpy里生成单位矩阵?
python sklearn模型中random_state参数的意义
多重检验中的FDR(false discovery rate, 错误发现率)是什么?
自助法(bootstrap)的0.632是怎么来的?
kNN算法有哪些缺点?