sklearn里的LabelEncoder什么用?

  统计/机器学习 监督式学习 Python    浏览次数:11975        分享
0

sklearn里的LabelEncoder什么用?很多代码里都有这个。

但是没搞清楚什么作用。已经是label了,为什么还要再encoder?


 

yukio   2018-02-07 09:16



   3个回答 
6

label encoder就是把lable编码的。比如label是一串地名,是无法直接输入到sklearn的分类模型里作为训练标签的,所以需要先把地名转成数字。然后LabelEncoder就是帮你做这件事的。

>>> from sklearn import preprocessing
>>> le = preprocessing.LabelEncoder()
>>> le.fit(["paris", "paris", "tokyo", "amsterdam"]);
>>> le.transform(["tokyo", "tokyo", "paris", "amsterdam", "amsterdam"]) 
array([2, 2, 1, 0, 0])


SofaSofa数据科学社区DS面试题库 DS面经

山中人   2018-02-25 22:04

2

把一些没什么上下文联系的文本转换成能作为input的数字,不然都没把文本输入到模型里去


SofaSofa数据科学社区DS面试题库 DS面经

mosthated   2018-02-25 03:02

0

再做特征工程时,我们需要处理已有特征,对于分类特征通常有两种处理方案:

  • 自然数编码

使用sklearn中的LabelEncoder方法,转换为数值型特征

  • 独热编码(one-hot encoding)

生成一个(n_examples * n_classes)大小的0~1矩阵,每个样本仅对应一个label

可以使用pandas中的get_dummies实现

SofaSofa数据科学社区DS面试题库 DS面经

betten   2018-02-27 16:09



  相关主题

GradientBoostingClassifier的每次输出结果不同   1回答

求sklearn.pipeline.Pipeline使用的例子   1回答

sklearn实现adaboost算法了吗?   1回答

sklearn中除了sgd以外,还有什么可以使用partial_fit方法吗?   1回答

查看sklearn版本   1回答

CatBoostClassifier里的rsm参量是什么意思?   1回答

sklearn模型当中的verbose是什么意思?   2回答

sklearn.linear_model.SGDClassifier中的参数n_iter设置问题   2回答

提取sklearn逻辑回归的模型系数   1回答

sklearn可以用gpu加速吗?   2回答

请问在sklearn怎么在已有的模型的基础上训练新的数据?   3回答

同一批样本数据,利用sklearn中二项逻辑回归预测同一批预测数据的概率,每次预测结果有很大不同   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!