关于sklearn独热的问题，想把两类编成一个独热-SofaSofa

长度宽度

a= ([[240., 20.],
       [ 90.,   6.],
       [240.,   6.],
       [180., 20.],
       [180.,   6.]])

mlb = MultiLabelBinarizer(a)
mlb.fit_transform(a)

返回结果：

    ([[0, 1, 0, 0, 1],
       [1, 0, 1, 0, 0],
       [1, 0, 0, 0, 1],
       [0, 1, 0, 1, 0],
       [1, 0, 0, 1, 0]])

请问我这独热行不行，回头预测的时候会不会有什么问题？

curiositychen 2022-04-23 21:41

从结果上看是对的；从出发点看，不是很明白对于数值变量为什么要做one-hot处理，直接用不是更好，信息量更大吗

Arsjun 2022-04-24 18:09

只有很特殊应用会有好处，比如training data包含所有可能的输入。这时相当于查表。如果training data不能包含所有输入，那你这种one-hot没法做插值，interpolation和exterpolation。比如test data是(200,10)，那one-hot没法用。

Zealing 2022-04-27 13:01

谢谢 - curiositychen 2022-04-29 10:09

关于sklearn独热的问题，想把两类编成一个独热