随机森林是如何计算测试样本的概率的?

  统计/机器学习 监督式学习    浏览次数:7181        分享
0

当我们用随机森林进行分类,最后的结果也是可以是概率的。这个概率是怎么计算的呢?

是 A)得到标签为1的树除以树的总个数吗?

还是 B)把每棵树得到的概率取平均?

还是 C)按照叶节点里样本的个数加权平均?

比如有三棵树,某个样本X在各个树被分到的叶节点的情况为

第一棵:(1,1,0)。第二棵:(1,1,0,0,0)。第三棵:(1)。


按照A方法,得到的概率为

$$\frac{2}{3}$$

按照B方法,得到的概率为

$$\frac{1}{3}\left(\frac{2}{3}+\frac{2}{5}+\frac{1}{1}\right)=\frac{31}{45}$$

按照C方法,得到的概率为

$$\frac{2+2+1}{3+5+1}=\frac{5}{9}$$

随机森里是按照哪种方法计算概率的呢?

 

猴老大   2018-10-29 11:05



    还没有回答。我来答!  


  相关主题

决策树是如何得到量化的概率,不只是0或1的标签?   2回答

决策树剪枝有什么策略或者注意事项?   2回答

决策树的深度和数据特征个数的关系   1回答

剪枝是什么意思   1回答

Adaboost里的树有没有可能权重是负数?   1回答

请问针对Adaboost、GBDT等集成学习同一个特征是否可以入模多次?   1回答

随机森林中增加树的数量对于偏差和方差的影响   2回答

lightgbm使用自定义损失函数后,二分类的预测结果不再是【0,1】区间   0回答

gbdt为什么需要泰勒公式展开进行节点分裂计算   2回答

Gradient tree boosting和random forest (随机森林) 有什么区别和联系   1回答

怎么得到randomforestregressor里每棵树的预测结果?   1回答

随机森林的模型一般都很大么?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!