怎么把sklearn里的iris dataset转为pandas.Dataframe的形式?

  统计/机器学习 Python    浏览次数:11253        分享
1

我load sklearn里自带的iris数据集,可是读完后它是numpy array的形式,也没有列名什么的,怎么把它转成有列名的pandas.DataFrame的形式?

谢谢各位!


 

ggg818   2018-02-23 12:10



   2个回答 
5

方法一:

from sklearn.datasets import load_iris
import pandas as pd
import numpy as np

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)


方法二:

iris数据在UCI网站上也有,可以从网站上导入


import pandas

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据


SofaSofa数据科学社区DS面试题库 DS面经

博观   2018-02-23 20:33

谢谢博观大牛!!! - ggg818   2018-02-23 22:07
1

如果你需要把y列也放进dataframe里的话

from sklearn import datasets
import pandas as pd
import numpy as np

iris = datasets.load_iris()
col_names = iris['feature_names'] + ['target']
data = pd.DataFrame(data= np.c_[iris['data'], iris['target']], columns=col_names)


SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2018-02-27 03:46



  相关讨论

sklearn GridSearchCV的结果cv_results_怎么转成pandas的DataFrame?

sklearn中除了sgd以外,还有什么可以使用partial_fit方法吗?

求sklearn.pipeline.Pipeline使用的例子

sklearn错误ImportError: cannot import name 'joblib'

python sklearn模型中random_state参数的意义

sklearn可以用gpu加速吗?

sklearn模型当中的verbose是什么意思?

查看sklearn版本

sklearn训练classifier的时候报错Unknown label type

sklearn算法里输入的数据集是要求pandas.DataFrame还是numpy.array呢

  随便看看

怎么在matplotlib.pyplot的plot上加上文字?

用户人群分层分析的RFM模型是什么?

人工神经网络有哪些常用的激活函数?

牛顿法到底是一阶优化算法还是二阶优化算法?

统计里的IQR是什么意思?