pandas读取csv文件遇到UnicodeDecodeError

  统计/机器学习 Python    浏览次数:1470        分享
0

我下面的代码读取csv文件

import pandas as pd
data = pd.read_csv('datafile.csv')

然后出现错误

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 12: invalid start byte

这个该如何解决?谢谢!

 

潇洒橙   2018-08-21 21:58



   2个回答 
4

read_csv里默认的encoding是'utf-8',但是你的文件里应该是有utf-8不能识别的乱码,所以需要换个编码方式

试试下面的

data = pd.read_csv('datafile.csv', encoding = "ISO-8859-1")


SofaSofa数据科学社区DS面试题库 DS面经

chrisliang   2018-08-22 22:11

2

今天使用sql导出的csv也是这个问题,除了导出设置是gbk, read_csv中的encoding我设置了gbk

SofaSofa数据科学社区DS面试题库 DS面经

Pan   2018-08-28 10:49



  相关主题

如何重命名pandas的dataframe的列名   2回答

pandas同时返回一个dataframe的前几行(head)和后几行(tail)   2回答

怎么利用pandas获得一个列联表(contingency table)?   1回答

pandas数据合并 merge 相同的列能不能合并   2回答

pandas里index的问题   1回答

pd.dataframe怎么同时对两个key排序?   1回答

pandas DataFrame去掉重复的行   1回答

pandas数据列顺序不同进行concat   1回答

怎么添加pandas的dataframe到已有的csv文件,并且不覆盖原内容   1回答

pandas读取文件的前几行   1回答

怎么按照index对pd.DataFrame的行排序?   1回答

用pandas处理一个很大的DataFrame时如何节省内存   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!