pandas读取csv中指定的某些列

  统计/机器学习 Python I/O    浏览次数:18233        分享
3

我有个很多很多列的csv文件,但是我只需要读取其中几列,比如id,age,gender,有什么方法吗?


 

Beck   2017-09-21 22:24



   2个回答 
9

设置参量usecols=['id', 'age', 'gender']

d = pd.read_csv('your_file_name.csv', usecols=['id', 'age', 'gender'])

同样适用于pd.read_table


SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2017-09-22 01:16

-1


d = pd.read_csv('your_file_name.csv')
d = d[['id', 'age', 'gender']]


SofaSofa数据科学社区DS面试题库 DS面经

ZackLi   2017-09-21 23:03

我现在就是这么做的,csv文件太大了,读取时间太久,而我只需要其中的几列而已,所以就想问问有没有可以只读取那几列的方法。 - Beck   2017-09-21 23:59


  相关讨论

pd.read_csv报错Error tokenizing data,如何跳过错误的行?

怎么用pandas直接读取被压缩成zip的csv文件?

pandas读取文件夹中所有的csv文件

pandas读取csv文件遇到UnicodeDecodeError

pandas dataframe存入csv文件时怎么忽略dataframe中的index?

python或者pandas读取excel xlsx文件中指定的一个sheet

pd.read_csv出现ParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 3

pandas读取文件的前几行

将pandas DataFrame保存成本地txt并删去列名

pandas怎么读入tsv格式的数据

  随便看看

'str' object has no attribute 'decode' 代码运行时有错误呢?请高手帮忙解决

随机梯度下降(sgd)的收敛问题

dropout rate一般设置多大?

回归问题中R方可以小于0吗?

Random Forest可以用来做聚类?