pandas读取csv文件遇到UnicodeDecodeError

  统计/机器学习 Python    浏览次数: 422
0

我下面的代码读取csv文件

import pandas as pd
data = pd.read_csv('datafile.csv')

然后出现错误

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 12: invalid start byte

这个该如何解决?谢谢!

 

潇洒橙   2018-08-21 21:58



   2个回答 
3

read_csv里默认的encoding是'utf-8',但是你的文件里应该是有utf-8不能识别的乱码,所以需要换个编码方式

试试下面的

data = pd.read_csv('datafile.csv', encoding = "ISO-8859-1")


SofaSofa数据科学社区 DS面经 问答 实战

chrisliang   2018-08-22 22:11

2

今天使用sql导出的csv也是这个问题,除了导出设置是gbk, read_csv中的encoding我设置了gbk

SofaSofa数据科学社区 DS面经 问答 实战

Pan   2018-08-28 10:49



  相关主题

如何把一个pandas的dataframe的columns转换成list   2回答

把pandas.DataFrame中所有行全部随机排列   3回答

pandas DataFrame去掉重复的行   1回答

pandas读取csv中指定的某些列   2回答

怎么利用pandas获得一个列联表(contingency table)?   1回答

pandas dataframe insert报错ValueError: unbounded slice   1回答

怎么把pandas dataframe中的一列转成一个list?   3回答

pandas读取文件的前几行   1回答

将pandas DataFrame保存成本地txt并删去列名   1回答

去掉pandas DataFrame的index的名字   2回答

pandas的DataFrame如何插入带有index的行数据?   1回答

pandas.DataFrame的index重新排列(从0开始)   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!