我用pandas read_csv读取
data= pd.read_csv('data.txt', sep='\t')
报错如下
ParserError: Error tokenizing data. C error: Expected 6 fields in line 2571, saw 7
就是说第2571行数据有错。因为我数据量比较大,所以想直接跳过这一行,有什么办法可以快速跳过报错的行吗?
1个回答
设置error_bad_lines参数为False,可以跳过所有有错误的行
data= pd.read_csv('data.txt', sep='\t', error_bad_lines=False)
不过通常要谨慎,因为如果文件中错误的行很多,你可能需要查看文件类型或者格式是否正确,而不是通过跳过错误的行
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
pandas dataframe存入csv文件时怎么忽略dataframe中的index?
1回答
统计substring在pandas dataframe中一列文本中出现的次数?
1回答
去掉pandas DataFrame的index的名字
2回答
将pandas DataFrame保存成本地txt并删去列名
1回答
pandas同时返回一个dataframe的前几行(head)和后几行(tail)
2回答
怎么删除pandas dataframe中index重复的行?
2回答
pandas报错: 'DataFrame' object has no attribute 'unique'
1回答
pandas里怎么把有multiindex的列拉平变成一层?
1回答
怎么改变pandas dataframe里column的顺序?
1回答
pandas读取文件的前几行
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!