全部问题问题热门未解答所有标签标签收藏收藏我要提问

XGBoost为什么可以通过叶子节点的权值w的L2模平方来控制树的复杂度？

统计/机器学习浏览次数：4630 分享

二维码

手机扫描二维码

机器学习面试也能刷题？

相关问题：

xgboost是怎么做到regularization的？

其中提到：叶节点的数量和叶节点的得分越高，树就越复杂。

『叶节点的数量』容易理解，请问『叶节点的得分越高』为什么会导致树就越复杂呢？

dzzxjl 2018-03-09 11:13

1个回答

这个是xgboost作者陈天骐关于xgboost的ppt，可以看一看

https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf

节点的权值作为惩罚可以防治模型过于细化。因为分得越细，越容易过拟合。说白了，就是不想让一些点分得太好，好到难以置信。换句话，如果每个叶都分得巨好，那么就需要“陈独秀同学，你先坐下”了。

本质，它是和“叶节点的数量”类似的惩罚，但是不仅防治分得细，还防止分得太好。

听起来有点矛盾，但这的确就是xgboost牛轰轰的思路！

SofaSofa数据科学社区 DS面试题库 DS面经

Jiho 2018-03-09 14:14

相关讨论

xgboost有正则项为什么还会过拟合呢？

XGBoost损失函数中正则项的理解

xgboost为什么会有seed？随机性体现在哪里？

stack多个xgboost效果并不理想

到底什么时候用lightgbm什么时候用xgb

GBDT和XGBoost使用的都是回归树，原理上是怎么支持解决分类问题的？

xgboost里的每棵树是不是等权重的？

xgboost展开到二阶导数有什么好处啊

xgboost中的决策树的复杂度是怎么定义的？

xgboost怎么调参？

随便看看

请问在sklearn怎么在已有的模型的基础上训练新的数据？

pandas.DataFrame选取最后k行

如果数据不是正态分布，能用3sigma原则剔除异常值吗？

numpy.array从行向量转为列向量

sklearn r2_score返回负数