8000个7特征的样本数据,对第四列的特征乘上不同的系数,为什么对于得到的训练结果没有影响
1个回答
对于树模型(决策树、随机森林、xgboost,lightgbm),对特征进行保序变换是不会影响模型结果的。
因为树在寻找到特征分裂点之后,小于它的样本都被放在左子节点,大于它的样本都在右子节点。你对一个特征做了乘法运算,这个是线性运算,自然也是保序的,也就是每个元素的大小顺序没有改变,所以训练出来的模型自然没有变化。
SofaSofa数据科学社区DS面试题库 DS面经
明白了,谢谢!
-
classifier
2020-02-12 17:30