pandas读取csv文件遇到UnicodeDecodeError

  统计/机器学习 Python    浏览次数: 202
0

我下面的代码读取csv文件

import pandas as pd
data = pd.read_csv('datafile.csv')

然后出现错误

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 12: invalid start byte

这个该如何解决?谢谢!

 

潇洒橙   2018-08-21 21:58



   2个回答 
2

read_csv里默认的encoding是'utf-8',但是你的文件里应该是有utf-8不能识别的乱码,所以需要换个编码方式

试试下面的

data = pd.read_csv('datafile.csv', encoding = "ISO-8859-1")


chrisliang   2018-08-22 22:11

1

今天使用sql导出的csv也是这个问题,除了导出设置是gbk, read_csv中的encoding我设置了gbk

Pan   2018-08-28 10:49



  相关主题

pandas读取csv中指定的某些列   2回答

怎么添加pandas的dataframe到已有的csv文件,并且不覆盖原内容   1回答

pandas df.head()报错AttributeError: 'NoneType' object has no attribute 'head'   1回答

pandas.DataFrame的index重新排列(从0开始)   2回答

pandas操作出现ValueError: The truth value of a Series is ambiguous.   1回答

pandas DataFrame去掉重复的行   1回答

pandas里index的问题   1回答

pandas dataframe insert报错ValueError: unbounded slice   1回答

如何对pandas dataframe的行做循环?   3回答

pandas读取文件夹中所有的csv文件   1回答

怎么把pandas dataframe中的一列转成一个list?   3回答

把pandas.DataFrame中所有行全部随机排列   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!