长度 宽度
a= ([[240., 20.],
[ 90., 6.],
[240., 6.],
[180., 20.],
[180., 6.]])
mlb = MultiLabelBinarizer(a)
mlb.fit_transform(a)
返回结果:
([[0, 1, 0, 0, 1],
[1, 0, 1, 0, 0],
[1, 0, 0, 0, 1],
[0, 1, 0, 1, 0],
[1, 0, 0, 1, 0]])
请问我这独热行不行,回头预测的时候会不会有什么问题?
2个回答
只有很特殊应用会有好处,比如training data包含所有可能的输入。这时相当于查表。如果training data不能包含所有输入,那你这种one-hot没法做插值,interpolation和exterpolation。比如test data是(200,10),那one-hot没法用。
SofaSofa数据科学社区DS面试题库 DS面经
谢谢
-
curiositychen
2022-04-29 10:09