GBDT的数据在使用前有什么需要注意的吗？-SofaSofa

RT .

Cypher 2020-12-13 22:29

2个回答

GBDT是一个树的boosting方法，并且用到的是回归树，一般来说树模型不需要对数据有太多的操作。如果要使用的话，GBDT也涉及到使用损失函数对预测值的负梯度方向信息进行更新模型，那么我觉得做归一化处理可以加速模型的预测效率。其次，如楼上所说，缺失值也是一个问题，GBDT对于缺失值没有很好的学习策略，不像xgboost，所以做好对数据的预处理也挺重要，但是数据的预处理和特征工程都是要做的事情，才会放到模型里学习。总结来说，没有什么要注意的，不过gbdt处理的是连续型的数据，做回归任务多一些。

SofaSofa数据科学社区 DS面试题库 DS面经

Cypher 2021-03-10 10:25

做好数据清洗和变形，比如在sklearn中不能有空缺值，分类变量要做01处理等等。

SofaSofa数据科学社区 DS面试题库 DS面经

strong.man 2020-12-20 21:27

GBDT的数据在使用前有什么需要注意的吗？

Warning

2个回答

Warning

Warning