比如,
car_length label
0 1 1
1 2 0
2 1.5,2 1
car_length 这个特征可以是0行是1,1行是2, 2行是1,2(代表取1或者2都可以)。
我想用一些树模型进行拟合,比如,gdbt,xgboost,请问该如何对car_length 这个特征进行处理?
1个回答
如果是数值的话,可以取这两个的平均值或者最大值或者最小值。
然后你看交叉验证的结果,哪个好就用哪个。
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
对于组合特征怎么理解?
1回答
什么情况下需要做特征选择?
1回答
分类问题 特征怎么选择
1回答
特征组合的重要性排序
1回答
SHAP可以解释二元分类模型吗?
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!