为什么随机森林比决策树更robust?

  统计/机器学习 监督式学习 模型验证    浏览次数:127        分享
0

随机森林是很多决策树组成的,那为什么比决策树更robust呢?就是因为树多?那么越多越robust吗?

 

Solomon   2019-04-10 11:39



   1个回答 
2

我的理解是:随机森林在训练每棵子树时,通过随机采样和随机抽特征的方式生成训练数据,避免生成太相似的树。差异性大的多课子树构成的随机森林,相当于增强了模型的多样性,也就导致其有较强的robust。所以关键点就是“随机”。


SofaSofa数据科学社区DS面试题库 DS面经

咸魚   2019-04-10 18:27

随机森林怎么避免生成太相似的树,有惩罚么 - 塔利班   2019-04-11 09:20
没有惩罚。样本抽样和特征抽样,不一样的样本和特征去训练子树 - 咸魚   2019-04-11 10:47
嗯,所以说总体上还是能生成N个结构不同的树,但是全靠随机 - 塔利班   2019-04-11 10:51
嗯,我的理解是这样的 - 咸魚   2019-04-11 10:56


  相关主题

python sklean中的决策树是用的哪一种决策树算法?   2回答

随机森林如何调参?   3回答

随机森林中增加树的数量对于偏差和方差的影响   2回答

怎么理解随机森林的oob error?   2回答

决策树算法ID3,C4.5和CART的特点、异同?   3回答

随机森林回归   1回答

随机森林是如何计算测试样本的概率的?   1回答

决策树、随机森林中的多重共线性问题   3回答

决策树的深度和数据特征个数的关系   1回答

如果采用非等权重的方法集成一个随机森林,会表现得更好嘛?   1回答

Extra Tree算法   1回答

决策树剪枝有什么策略或者注意事项?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!