怎么把pyspark RDD dataframe转为pandas.DataFrame?

  统计/机器学习 Python    浏览次数:4129        分享
0

怎么把pyspark RDD dataframe转为pandas.DataFrame?


 

thatdeep   2018-04-18 23:14



   1个回答 
4


df = my_spark_df.toPandas()


SofaSofa数据科学社区DS面试题库 DS面经

strong.man   2018-04-20 10:54



  相关讨论

怎么对pyspark.sql.dataframe按照某一列降序排列?

怎么对pyspark dataframe更改列名

pyspark里如何进行SELECT DISTINCT操作?

pyspark中怎么对dataframe里的行按照列去重?

pyspark dataframe的collect()方法是什么意思?

pyspark里unpersist()什么作用?

怎么在pyspark里把dataframe写入csv文件?

返回pyspark dataframe的行数?

怎么将两个pyspark dataframe以串联的形式合并?

得到一个pyspark.sql.dataframe中所有列的名称

  随便看看

numpy里生成单位矩阵?

python sklearn模型中random_state参数的意义

多重检验中的FDR(false discovery rate, 错误发现率)是什么?

自助法(bootstrap)的0.632是怎么来的?

kNN算法有哪些缺点?