怎么把sklearn里的iris dataset转为pandas.Dataframe的形式?

  统计/机器学习 Python    浏览次数: 1233
0

我load sklearn里自带的iris数据集,可是读完后它是numpy array的形式,也没有列名什么的,怎么把它转成有列名的pandas.DataFrame的形式?

谢谢各位!


 

ggg818   2018-02-23 12:10



   2个回答 
4

方法一:

from sklearn.datasets import load_iris
import pandas as pd
import numpy as np

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)


方法二:

iris数据在UCI网站上也有,可以从网站上导入


import pandas

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据


博观   2018-02-23 20:33

谢谢博观大牛!!! - ggg818   2018-02-23 22:07
1

如果你需要把y列也放进dataframe里的话

from sklearn import datasets
import pandas as pd
import numpy as np

iris = datasets.load_iris()
col_names = iris['feature_names'] + ['target']
data = pd.DataFrame(data= np.c_[iris['data'], iris['target']], columns=col_names)


Nagozi   2018-02-27 03:46



  相关主题

python或者pandas读取excel xlsx文件中指定的一个sheet   1回答

pandas dataframe insert报错ValueError: unbounded slice   1回答

pandas DataFrame中经常出现SettingWithCopyWarning   2回答

pandas里index的问题   1回答

pandas读取文件的前几行   1回答

如何重命名pandas的dataframe的列名   2回答

pandas df.head()报错AttributeError: 'NoneType' object has no attribute 'head'   1回答

pandas读取csv文件遇到UnicodeDecodeError   2回答

pandas读取csv中指定的某些列   2回答

如何把一个pandas的dataframe的columns转换成list   1回答

pandas操作出现ValueError: The truth value of a Series is ambiguous.   1回答

行数很多的pandas DataFrame如何在jupyter中完整显示?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!