sframe和pandas.DataFrame哪个好用?

  统计/机器学习 开放问题 Python    浏览次数: 1525
3

我一般都是用pandas.DataFrame。最近听不少人说sframe,不知道有没有人对两个都熟悉的,能讲一讲它们各自的优势和缺陷吗?

 

雕牌   2017-04-04 08:27



   3个回答 
6

pandas的DataFrame和graphlab的SFrame,我个人觉得pandas更常用一些。但是它们虽然都是提供了dataframe这种数据结构,但是本质上还是有很多不同的地方的。

1. 存储方式。pandas.DataFrame必须存储在内存当中;而SFrame可以选择存在内存或者硬盘空间上。所以SFrame可以放下更大的数据,其实S就是指的scability,可延展性。


2. DataFrame是可变的,SFrame却不是。换句话说,当我们建立好一个SFrame之后,其中的数值就不能被修改了。


3. SFrame只支持64位CPU,只支持python2.7。而DataFrame没有这些限制。


4. 用法不完全一样。具体可以参考这里



SofaSofa数据科学社区 DS面经 问答 实战

sasa   2017-04-27 11:10

4

你们都是土豪么?

最大的区别难道不是GraphLab SFrame是付费的,Pandas是免费的么?


SofaSofa数据科学社区 DS面经 问答 实战

KingBug   2017-05-02 09:49

3

pandas.DataFrame放在内存里,读取也快。

SFrame更适合大数据,比如1T以上的那种,可以放在磁盘空间上,所以读取也相对较慢。

SofaSofa数据科学社区 DS面经 问答 实战

Nagozi   2017-04-27 11:49



  相关主题

用pandas处理一个很大的DataFrame时如何节省内存   2回答

如何对pandas dataframe的行做循环?   3回答

怎么把pandas dataframe中的一列转成一个list?   3回答

pd Series的用法问题   1回答

怎么利用pandas获得一个列联表(contingency table)?   1回答

将pandas DataFrame保存成本地txt并删去列名   1回答

pandas pop KeyError求帮助!   3回答

pandas读取文件的前几行   1回答

pandas DataFrame中经常出现SettingWithCopyWarning   2回答

如何复制一个pandas DataFrame   1回答

pandas的DataFrame如何插入带有index的行数据?   1回答

pandas DataFrame去掉重复的行   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!