sklearn里的LabelEncoder什么用?

  统计/机器学习 监督式学习 Python    浏览次数: 2403
0

sklearn里的LabelEncoder什么用?很多代码里都有这个。

但是没搞清楚什么作用。已经是label了,为什么还要再encoder?


 

yukio   2018-02-07 09:16



   3个回答 
5

label encoder就是把lable编码的。比如label是一串地名,是无法直接输入到sklearn的分类模型里作为训练标签的,所以需要先把地名转成数字。然后LabelEncoder就是帮你做这件事的。

>>> from sklearn import preprocessing
>>> le = preprocessing.LabelEncoder()
>>> le.fit(["paris", "paris", "tokyo", "amsterdam"]);
>>> le.transform(["tokyo", "tokyo", "paris", "amsterdam", "amsterdam"]) 
array([2, 2, 1, 0, 0])


SofaSofa数据科学社区 DS面经 问答 实战

山中人   2018-02-25 22:04

2

把一些没什么上下文联系的文本转换成能作为input的数字,不然都没把文本输入到模型里去


SofaSofa数据科学社区 DS面经 问答 实战

mosthated   2018-02-25 03:02

0

再做特征工程时,我们需要处理已有特征,对于分类特征通常有两种处理方案:

  • 自然数编码

使用sklearn中的LabelEncoder方法,转换为数值型特征

  • 独热编码(one-hot encoding)

生成一个(n_examples * n_classes)大小的0~1矩阵,每个样本仅对应一个label

可以使用pandas中的get_dummies实现

SofaSofa数据科学社区 DS面经 问答 实战

betten   2018-02-27 16:09



  相关主题

sklearn SGDClassifier的partial_fit是什么意思?   2回答

sklearn里learning_rate什么意思?   2回答

GradientBoostingClassifier的每次输出结果不同   1回答

sklearn实现adaboost算法了吗?   1回答

lightgbm.LGBMModel和lightgbm.LGBMClassifier该用哪个?   1回答

sklearn.linear_model.SGDClassifier能做小批量学习(mini-batch)吗?   2回答

sklearn中的predict_proba方法的返回值的意义   2回答

sklearn predict的默认阈值   2回答

sklearn.linear_model.SGDClassifier中的参数n_iter设置问题   2回答

sklearn.svm.SVC中的gamma和rbf中的sigma什么关系   1回答

python sklearn模型中random_state参数的意义   2回答

sklearn的模型如何保存下来?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!