一个数据预处理的问题

  统计/机器学习 数据预处理 Python    浏览次数:1736        分享
0

我有一个特征,其中的值分别是A,A&B,C,A&C这种形式,我是不是应该处理成{1,0,0;1,1,0;1,0,1;}这种形式,不知道

python有什么库可以处理成这样,sklearn可以吗?求大佬指教

 

Ccky   2020-06-17 15:26



   1个回答 
2

sklearn里有现成的模块实现你的要求,官方文档里有例子

链接sklearn.preprocessing.MultiLabelBinarizer.html

SofaSofa数据科学社区DS面试题库 DS面经

我小宋   2020-06-22 00:10

非常感谢 - Ccky   2020-06-22 09:25


  相关讨论

怎么求一个数组的移动平均数

怎麼將dataframe 欄位 對應到原有的csv檔 而寫入

让DataFrame中的行按照某一列元素的绝对值从大到小排列

怎么把dataframe的一列转成整数类型

python中怎么把千位分隔符以及货币符号去掉转成数值形式?

把分组频数统计的结果添加到原来dataframe中

str.replace为什么会将数字替换成NaN

z-score标准化不适用于处理什么样的数据?

什么时候需要对y或者特征进行对数变换?

机器学习中的过采样和欠采样是什么意思?

  随便看看

对于xgboost,还有必要做很多特征工程吗?

如何在numpy array尾部增加一行

sklearn训练classifier的时候报错Unknown label type

在使用PCA降维时,有哪些坑?

pandas.DataFrame选取最后k行