怎么把sklearn里的iris dataset转为pandas.Dataframe的形式?

  统计/机器学习 Python    浏览次数: 1602
0

我load sklearn里自带的iris数据集,可是读完后它是numpy array的形式,也没有列名什么的,怎么把它转成有列名的pandas.DataFrame的形式?

谢谢各位!


 

ggg818   2018-02-23 12:10



   2个回答 
4

方法一:

from sklearn.datasets import load_iris
import pandas as pd
import numpy as np

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)


方法二:

iris数据在UCI网站上也有,可以从网站上导入


import pandas

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据


SofaSofa数据科学社区 DS面经 问答 实战

博观   2018-02-23 20:33

谢谢博观大牛!!! - ggg818   2018-02-23 22:07
1

如果你需要把y列也放进dataframe里的话

from sklearn import datasets
import pandas as pd
import numpy as np

iris = datasets.load_iris()
col_names = iris['feature_names'] + ['target']
data = pd.DataFrame(data= np.c_[iris['data'], iris['target']], columns=col_names)


SofaSofa数据科学社区 DS面经 问答 实战

Nagozi   2018-02-27 03:46



  相关主题

python sklearn模型中random_state参数的意义   2回答

sklearn的模型如何保存下来?   2回答

sklearn训练classifier的时候报错Unknown label type   1回答

查看sklearn版本   1回答

怎么把pandas dataframe中的一列转成一个list?   3回答

pandas报错ValueError: Cannot convert non-finite values (NA or inf) to integer   1回答

pandas dataframe insert报错ValueError: unbounded slice   1回答

pandas里index的问题   1回答

怎么添加pandas的dataframe到已有的csv文件,并且不覆盖原内容   1回答

pandas pop KeyError求帮助!   3回答

行数很多的pandas DataFrame如何在jupyter中完整显示?   1回答

pd Series的用法问题   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!