怎么把sklearn里的iris dataset转为pandas.Dataframe的形式?

  统计/机器学习 Python    浏览次数: 685
0

我load sklearn里自带的iris数据集,可是读完后它是numpy array的形式,也没有列名什么的,怎么把它转成有列名的pandas.DataFrame的形式?

谢谢各位!


 

ggg818   2018-02-23 12:10



   2个回答 
4

方法一:

from sklearn.datasets import load_iris
import pandas as pd
import numpy as np

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)


方法二:

iris数据在UCI网站上也有,可以从网站上导入


import pandas

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据


博观   2018-02-23 20:33

谢谢博观大牛!!! - ggg818   2018-02-23 22:07
1

如果你需要把y列也放进dataframe里的话

from sklearn import datasets
import pandas as pd
import numpy as np

iris = datasets.load_iris()
col_names = iris['feature_names'] + ['target']
data = pd.DataFrame(data= np.c_[iris['data'], iris['target']], columns=col_names)


Nagozi   2018-02-27 03:46



  相关主题

pandas里index的问题   1回答

把pandas.DataFrame中所有行全部随机排列   2回答

如何重命名pandas的dataframe的列名   2回答

如何把一个pandas的dataframe的columns转换成list   1回答

如何对pandas dataframe的行做循环?   1回答

把pandas df写入csv时UnicodeEncodeError   1回答

pandas读取文件夹中所有的csv文件   1回答

pandas DataFrame去掉重复的行   1回答

怎么把pandas dataframe中的一列转成一个list?   3回答

pandas DataFrame中经常出现SettingWithCopyWarning   2回答

pandas的DataFrame如何插入带有index的行数据?   1回答

怎么把pyspark RDD dataframe转为pandas.DataFrame?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!