sframe和pandas.DataFrame哪个好用?

  统计/机器学习 开放问题 Python
3

我一般都是用pandas.DataFrame。最近听不少人说sframe,不知道有没有人对两个都熟悉的,能讲一讲它们各自的优势和缺陷吗?

 

雕牌   2017-04-04 08:27



   3个回答 
6

pandas的DataFrame和graphlab的SFrame,我个人觉得pandas更常用一些。但是它们虽然都是提供了dataframe这种数据结构,但是本质上还是有很多不同的地方的。

1. 存储方式。pandas.DataFrame必须存储在内存当中;而SFrame可以选择存在内存或者硬盘空间上。所以SFrame可以放下更大的数据,其实S就是指的scability,可延展性。


2. DataFrame是可变的,SFrame却不是。换句话说,当我们建立好一个SFrame之后,其中的数值就不能被修改了。


3. SFrame只支持64位CPU,只支持python2.7。而DataFrame没有这些限制。


4. 用法不完全一样。具体可以参考这里



sasa   2017-04-27 11:10

4

你们都是土豪么?

最大的区别难道不是GraphLab SFrame是付费的,Pandas是免费的么?


KingBug   2017-05-02 09:49

3

pandas.DataFrame放在内存里,读取也快。

SFrame更适合大数据,比如1T以上的那种,可以放在磁盘空间上,所以读取也相对较慢。

Nagozi   2017-04-27 11:49



相关问题

用pandas处理一个很大的DataFrame时如何节省内存   2回答

pandas.DataFrame的index重新排列(从0开始)   2回答

pandas df.head()报错AttributeError: 'NoneType' object has no attribute 'head'   1回答

pandas DataFrame中经常出现SettingWithCopyWarning   2回答

如何重命名pandas的dataframe的列名   2回答

pandas读取csv中指定的某些列   2回答

pandas读取文件的前几行   1回答

去掉pandas DataFrame的index的名字   2回答

把pandas df写入csv时UnicodeEncodeError   1回答

pandas里index的问题   1回答

如何复制一个pandas DataFrame   1回答

把pandas.DataFrame中所有行全部随机排列   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!