一个数据预处理的问题

  统计/机器学习 数据预处理 Python    浏览次数:312        分享
0

我有一个特征,其中的值分别是A,A&B,C,A&C这种形式,我是不是应该处理成{1,0,0;1,1,0;1,0,1;}这种形式,不知道

python有什么库可以处理成这样,sklearn可以吗?求大佬指教

 

Ccky   2020-06-17 15:26



   1个回答 
2

sklearn里有现成的模块实现你的要求,官方文档里有例子

链接sklearn.preprocessing.MultiLabelBinarizer.html

SofaSofa数据科学社区DS面试题库 DS面经

我小宋   2020-06-22 00:10

非常感谢 - Ccky   2020-06-22 09:25


  相关主题

把分组频数统计的结果添加到原来dataframe中   1回答

python中怎么把千位分隔符以及货币符号去掉转成数值形式?   1回答

怎么把dataframe的一列转成整数类型   2回答

python 读json 错误 ValueError: Unexpected character found when decoding array value (2)   0回答

怎麼將dataframe 欄位 對應到原有的csv檔 而寫入   1回答

str.replace为什么会将数字替换成NaN   1回答

让DataFrame中的行按照某一列元素的绝对值从大到小排列   1回答

怎么求一个数组的移动平均数   1回答

机器学习中的维度灾难怎么防止和克服?   0回答

怎么对特征做标准化使得数值都是正数?   3回答

二值化和Onehot表示的特征哪一个较好?   1回答

在数据预处理阶段,特征的标准化有哪些方法?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!