sframe和pandas.DataFrame哪个好用?

  统计/机器学习 开放问题 Python    浏览次数: 1361
3

我一般都是用pandas.DataFrame。最近听不少人说sframe,不知道有没有人对两个都熟悉的,能讲一讲它们各自的优势和缺陷吗?

 

雕牌   2017-04-04 08:27



   3个回答 
6

pandas的DataFrame和graphlab的SFrame,我个人觉得pandas更常用一些。但是它们虽然都是提供了dataframe这种数据结构,但是本质上还是有很多不同的地方的。

1. 存储方式。pandas.DataFrame必须存储在内存当中;而SFrame可以选择存在内存或者硬盘空间上。所以SFrame可以放下更大的数据,其实S就是指的scability,可延展性。


2. DataFrame是可变的,SFrame却不是。换句话说,当我们建立好一个SFrame之后,其中的数值就不能被修改了。


3. SFrame只支持64位CPU,只支持python2.7。而DataFrame没有这些限制。


4. 用法不完全一样。具体可以参考这里



sasa   2017-04-27 11:10

4

你们都是土豪么?

最大的区别难道不是GraphLab SFrame是付费的,Pandas是免费的么?


KingBug   2017-05-02 09:49

3

pandas.DataFrame放在内存里,读取也快。

SFrame更适合大数据,比如1T以上的那种,可以放在磁盘空间上,所以读取也相对较慢。

Nagozi   2017-04-27 11:49



  相关主题

用pandas处理一个很大的DataFrame时如何节省内存   2回答

将pandas.DataFrame中的-1全部换成0   1回答

怎么把pandas dataframe中的一列转成一个list?   3回答

怎么添加pandas的dataframe到已有的csv文件,并且不覆盖原内容   1回答

pandas的DataFrame如何插入带有index的行数据?   1回答

pd Series的用法问题   1回答

把pandas.DataFrame中所有行全部随机排列   2回答

如何复制一个pandas DataFrame   1回答

pandas DataFrame中经常出现SettingWithCopyWarning   2回答

pandas读取文件夹中所有的csv文件   1回答

pandas操作出现ValueError: The truth value of a Series is ambiguous.   1回答

如何重命名pandas的dataframe的列名   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!