pandas读取csv中指定的某些列

  统计/机器学习 Python    浏览次数:15490        分享
3

我有个很多很多列的csv文件,但是我只需要读取其中几列,比如id,age,gender,有什么方法吗?


 

Beck   2017-09-21 22:24



   2个回答 
9

设置参量usecols=['id', 'age', 'gender']

d = pd.read_csv('your_file_name.csv', usecols=['id', 'age', 'gender'])

同样适用于pd.read_table


SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2017-09-22 01:16

-1


d = pd.read_csv('your_file_name.csv')
d = d[['id', 'age', 'gender']]


SofaSofa数据科学社区DS面试题库 DS面经

ZackLi   2017-09-21 23:03

我现在就是这么做的,csv文件太大了,读取时间太久,而我只需要其中的几列而已,所以就想问问有没有可以只读取那几列的方法。 - Beck   2017-09-21 23:59


  相关主题

pd.cut怎么用?   2回答

怎么删除pandas dataframe中index重复的行?   2回答

pandas.DataFrame的index重新排列(从0开始)   2回答

如何重命名pandas的dataframe的列名   2回答

怎么利用pandas获得一个列联表(contingency table)?   1回答

怎么把一个pandas数据框用append的方式添加到现有的csv文件?   2回答

pandas新建一个只有一行的dataframe时结果返回空的dataframe   1回答

pandas报错ValueError: Cannot convert non-finite values (NA or inf) to integer   1回答

如何对pandas dataframe的行做循环?   3回答

pd.read_csv报错Error tokenizing data,如何跳过错误的行?   1回答

pandas按照两列sort_values,一个升序一个降序   1回答

pandas操作出现ValueError: The truth value of a Series is ambiguous.   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!